字型所使用的字元集
所有字型都會使用字元集。 字元集包含標點符號、數位、大寫和小寫字母,以及所有其他可列印字元。 字元集的每個元素都會以數位來識別。
使用中的大部分字元集都是美國 ASCII 字元集的超集,其會定義 32 到 127 的 96 個數值的字元。 字元集有五個主要群組:
- 窗戶
- Unicode
- OEM(原始裝置製造商)
- 象徵
- 廠商特定
Windows 字元集
Windows 字元集是最常用的字元集。 它基本上相當於 ANSI 字元集。 空白字元是 Windows 字元集中的第一個字元。 其十六進位值為 0x20 (十進位 32)。 Windows 字元集中的最後一個字元具有0xFF十六進位值(十進位 255)。
許多字型會指定預設字元。 每當對不在字型中的字元提出要求時,系統就會提供這個預設字元。 許多使用 Windows 字元集的字型會將句號 (.) 指定為預設字元。 TrueType 和 OpenType 字型通常會使用開啟方塊作為預設字元。
字型會使用稱為四邊形的斷字元來分隔單字和對齊文字。 大部分使用 Windows 字元集的字型都會指定空白字元做為斷字元。
Unicode 字元集
Windows 字元集會使用 8 位來代表每個字元;因此,可以使用 8 位表示的最大字元數是 256 (2^8)。 這通常足以供西方語言使用,包括法文、德文、西班牙文和其他語言所使用的變音符號。 不過,東方語言採用數千個不同的字元,無法使用單一位元組編碼配置進行編碼。 隨著計算機商業的激增,已開發雙位元組編碼配置,以便以8位、16位、24位或32位序列來表示字元。 這需要複雜的傳遞演算法;即便如此,使用不同的程式代碼集,可能會在兩部不同的計算機上產生完全不同的結果。
為了解決多個編碼配置的問題,已開發數據表示法的 Unicode 標準。 16 位字元編碼配置,Unicode 可以代表 65,536 (2^16) 個字元,這足以包含現今計算機商務中的所有語言,以及標點符號、數學符號和擴充空間。 Unicode 會為每個字元建立唯一的程式代碼,以確保字元翻譯一律正確無誤。
OEM 字元集
OEM 字元集通常用於全螢幕 MS-DOS 工作階段中,以進行屏幕顯示。 在 OEM、美國 ASCII 和 Windows 字元集中,字元 32 到 127 通常相同。 OEM 字元集中的其他字元 (0 到 31 和 128 到 255) 對應到可以在全螢幕 MS-DOS 工作階段中顯示的字元。 這些字元通常與 Windows 字元不同。
符號字元集
符號字元集包含一般用來表示數學和科學公式的特殊字元。
廠商特定的字元集
許多印表機和其他輸出裝置會根據與 Windows 和 OEM 集合不同的字元集提供字型,例如擴充二進位編碼十進位交換碼 (EBCDIC) 字元集。 若要使用這些字元集的其中一個,印表機驅動程式會從Windows字元集轉譯為廠商特定的字元集。