Aracılığıyla paylaş


Yazı Tipleri Tarafından Kullanılan Karakter Kümeleri

Tüm yazı tipleri bir karakter kümesi kullanır. Karakter kümesi noktalama işaretleri, sayılar, büyük ve küçük harfler ve diğer tüm yazdırılabilir karakterleri içerir. Bir karakter kümesinin her öğesi bir sayı ile tanımlanır.

Kullanımdaki karakter kümelerinin çoğu, 32 ile 127 arasında 96 sayısal değer için karakterleri tanımlayan ABD ASCII karakter kümesinin üst kümeleridir. Beş ana karakter kümesi grubu vardır:

  • Windows
  • Unicode
  • OEM (orijinal ekipman üreticisi)
  • Sembol
  • Satıcıya özgü

Windows Karakter Kümesi

Windows karakter kümesi en yaygın kullanılan karakter kümesidir. Temelde ANSI karakter kümesine eşdeğerdir. Boş karakter, Windows karakter kümesindeki ilk karakterdir. 0x20 onaltılık değeri vardır (ondalık 32). Windows karakter kümesindeki son karakterin onaltılık değeri 0xFF (ondalık 255) olur.

Birçok yazı tipi varsayılan bir karakter belirtir. Yazı tipinde olmayan bir karakter için her istek yapıldığında sistem bu varsayılan karakteri sağlar. Windows karakter kümesini kullanan birçok yazı tipi, varsayılan karakter olarak nokta (.) belirtir. TrueType ve OpenType yazı tipleri genellikle varsayılan karakter olarak açık bir kutu kullanır.

Yazı tipleri, sözcükleri ayırmak ve metni iki yana yaslamak için dörtlü olarak adlandırılan kesme karakteri kullanır. Windows karakter kümesini kullanan yazı tiplerinin çoğu, boş karakterin kesme karakteri olarak görevleneceğini belirtir.

Unicode Karakter Kümesi

Windows karakter kümesi her karakteri temsil etmek için 8 bit kullanır; bu nedenle, 8 bit kullanılarak ifade edilebilecek karakter sayısı üst sınırı 256'dır (2^8). Bu genellikle Fransızca, Almanca, İspanyolca ve diğer dillerde kullanılan aksan işaretleri de dahil olmak üzere Batı dilleri için yeterlidir. Ancak Doğu dilleri, tek baytlı bir kodlama düzeni kullanılarak kodlanamayan binlerce ayrı karakter kullanır. Bilgisayar ticaretinin yaygınlaşmasıyla birlikte, karakterlerin 8 bit, 16 bit, 24 bit veya 32 bit dizilerle temsil edilebilmesi için çift baytlı kodlama düzenleri geliştirilmiştir. Bunun için karmaşık geçirme algoritmaları gerekir; yine de, farklı kod kümelerini kullanmak iki farklı bilgisayarda tamamen farklı sonuçlar verebilir.

Birden çok kodlama düzeni sorununu gidermek için, veri gösterimi için Unicode standardı geliştirilmiştir. 16 bit karakter kodlama şeması olan Unicode, 65.536 (2^16) karakteri temsil edebilir. Bu, günümüzde bilgisayar ticaretindeki tüm dillerin yanı sıra noktalama işaretlerini, matematiksel simgeleri ve genişletme için yer kapsamak için yeterlidir. Unicode, karakter çevirisi her zaman doğru olduğundan emin olmak için her karakter için benzersiz bir kod oluşturur.

OEM Karakter Kümesi

OEM karakter kümesi genellikle ekran görüntüsü için tam ekran MS-DOS oturumlarında kullanılır. 32 ile 127 arası karakterler genellikle OEM, ABD ASCII ve Windows karakter kümelerinde aynıdır. OEM karakter kümesindeki diğer karakterler (0 - 31 ve 128 - 255) tam ekran MS-DOS oturumunda görüntülenebilen karakterlere karşılık gelir. Bu karakterler genellikle Windows karakterlerinden farklıdır.

Sembol Karakter Kümesi

Sembol karakter kümesi genellikle matematiksel ve bilimsel formülleri temsil etmek için kullanılan özel karakterler içerir.

Satıcıya Özgü Karakter Kümeleri

Birçok yazıcı ve diğer çıkış cihazları, Windows ve OEM kümelerinden farklı karakter kümelerini temel alan yazı tipleri sağlar. Örneğin, Genişletilmiş İkili Kodlu Ondalık Değişim Kodu (EBCDIC) karakter kümesi. Bu karakter kümelerinden birini kullanmak için, yazıcı sürücüsü Windows karakter kümesinden satıcıya özgü karakter kümesine çevirir.