Zestawy znaków używane przez czcionki
Wszystkie czcionki używają zestawu znaków. Zestaw znaków zawiera znaki interpunkcyjne, cyfry, wielkie i małe litery oraz wszystkie inne znaki drukowane. Każdy element zestawu znaków jest identyfikowany przez liczbę.
Większość używanych zestawów znaków to nadzbiory zestawu znaków ASCII STANÓW Zjednoczonych, który definiuje znaki dla 96 wartości liczbowych z zakresu od 32 do 127. Istnieje pięć głównych grup zestawów znaków:
- Windows
- Unicode
- OEM (producent oryginalnego sprzętu)
- Symbol
- Specyficzne dla dostawcy
Zestaw znaków systemu Windows
Zestaw znaków systemu Windows jest najczęściej używanym zestawem znaków. Zasadniczo odpowiada zestawowi znaków ANSI. Pusty znak jest pierwszym znakiem w zestawie znaków systemu Windows. Ma wartość szesnastkowa 0x20 (dziesiętna 32). Ostatni znak w zestawie znaków systemu Windows ma wartość szesnastkowa 0xFF (dziesiętna 255).
Wiele czcionek określa znak domyślny. Za każdym razem, gdy żądanie jest wykonywane dla znaku, który nie znajduje się w czcionki, system udostępnia ten domyślny znak. Wiele czcionek korzystających z zestawu znaków systemu Windows określa kropkę (.) jako znak domyślny. Czcionki TrueType i OpenType zwykle używają otwartego pola jako domyślnego znaku.
Czcionki używają znaku podziału nazywanego czworokątem, aby oddzielić wyrazy i uzasadnić tekst. Większość czcionek korzystających z zestawu znaków systemu Windows określa, że pusty znak będzie pełnić rolę znaku przerwania.
Zestaw znaków Unicode
Zestaw znaków systemu Windows używa 8 bitów do reprezentowania każdego znaku; dlatego maksymalna liczba znaków, które można wyrazić przy użyciu 8 bitów, wynosi 256 (2^8). Zwykle jest to wystarczające dla języków zachodnich, w tym znaków diakrytycznych używanych w języku francuskim, niemieckim, hiszpańskim i innych językach. Języki wschodnie stosują jednak tysiące oddzielnych znaków, których nie można kodować przy użyciu schematu kodowania jedno bajtowego. Wraz z rozprzestrzenianiem się handlu komputerowego opracowano schematy kodowania dwubajtowego, dzięki czemu znaki mogą być reprezentowane w 8-bitowych, 16-bitowych, 24-bitowych lub 32-bitowych sekwencjach. Wymaga to skomplikowanych algorytmów przekazywania; mimo to użycie różnych zestawów kodu może przynieść zupełnie inne wyniki na dwóch różnych komputerach.
Aby rozwiązać problem wielu schematów kodowania, opracowano standard Unicode dla reprezentacji danych. 16-bitowy schemat kodowania znaków Unicode może reprezentować 65 536 znaków (2^16), co wystarczy, aby uwzględnić wszystkie języki w handlu komputerowym dzisiaj, a także znaki interpunkcyjne, symbole matematyczne i miejsce na rozszerzenie. Unicode ustanawia unikatowy kod dla każdego znaku, aby zapewnić, że tłumaczenie znaków jest zawsze dokładne.
Zestaw znaków producenta OEM
Zestaw znaków OEM jest zwykle używany w sesjach pełnoekranowych MS-DOS na potrzeby wyświetlania ekranu. Znaki od 32 do 127 są zwykle takie same w zestawach znaków OEM, US ASCII i Windows. Pozostałe znaki w zestawie znaków OEM (od 0 do 31 i 128 do 255) odpowiadają znakom, które mogą być wyświetlane w sesji MS-DOS pełnoekranowej. Te znaki są zazwyczaj inne niż znaki systemu Windows.
Zestaw znaków symboli
Zestaw znaków Symbol zawiera znaki specjalne używane zazwyczaj do reprezentowania formuł matematycznych i naukowych.
Zestawy znaków specyficzne dla dostawcy
Wiele drukarek i innych urządzeń wyjściowych udostępnia czcionki oparte na zestawach znaków, które różnią się od zestawów systemu Windows i OEM, na przykład rozszerzony kod binarny kod dziesiętny (EBCDIC) zestawu znaków. Aby użyć jednego z tych zestawów znaków, sterownik drukarki tłumaczy się z zestawu znaków systemu Windows na zestaw znaków specyficzny dla dostawcy.