Delen via


Tekensets

Een tekenset is een toewijzing van tekens aan de identificatiecodewaarden. De tekenset die tegenwoordig het meest wordt gebruikt op computers, is Unicode-, een globale standaard voor tekencodering. Windows-toepassingen maken intern gebruik van de UTF-16-implementatie van Unicode. In UTF-16 worden de meeste tekens geïdentificeerd door twee-bytecodes. De minder gebruikte aanvullende tekens worden vertegenwoordigd door een surrogaatpaar, een paar twee-bytecodes. Zie Surrogaten en Aanvullende tekensvoor meer informatie.

Sommige Windows-toepassingen moeten werken met de oudere tekensets die systeemeigen zijn voor Windows Me/98/95. Windows-codepagina's ervoor zorgen dat uw toepassing met deze tekensets kan werken. Deze tekensets kunnen worden onderverdeeld in:

  • tekensets met één byte (SBCS). In een SBCS wordt elk teken geïdentificeerd door een waarde die één byte breed is.
  • Tekensets met meerderebytes, met name de dubbel-bytetekensets (DBCS). Multibyte-tekensets bieden een middel om het grote aantal tekens in veel Aziatische talen weer te geven.

Zie de volgende onderwerpen voor meer informatie:

over Unicode- en tekensets