Partager via


Jeux de caractères

Un « jeu de caractères » est un mappage de caractères à leurs valeurs de code d’identification. Le jeu de caractères le plus couramment utilisé dans les ordinateurs aujourd’hui est Unicode , une norme globale pour l’encodage de caractères. En interne, les applications Windows utilisent l’implémentation UTF-16 d’Unicode. Dans UTF-16, la plupart des caractères sont identifiés par des codes à deux octets. Les caractères supplémentaires les moins couramment utilisés sont représentés par une paire de substitution, qui est une paire de codes à deux octets. Pour plus d’informations, consultez substitution et caractères supplémentaires.

Certaines applications Windows doivent utiliser les jeux de caractères plus anciens natifs de Windows Me/98/95. pages de codes Windows autoriser votre application à utiliser ces jeux de caractères. Ces jeux de caractères peuvent être divisés en :

  • jeux de caractères sur un octet (SBCS). Dans un SBCS, chaque caractère est identifié par une valeur d’une largeur d’octet.
  • Jeux de caractères multioctets, en particulier les jeux de caractères double octets (DBCS). Les jeux de caractères multioctets fournissent un moyen de représenter le grand nombre de caractères dans de nombreuses langues asiatiques.

Pour plus d’informations, consultez les rubriques suivantes :

à propos des jeux de caractères Et Unicode