Conjuntos de Caracteres
Um "conjunto de caracteres" é um mapeamento de caracteres para seus valores de código de identificação. O conjunto de caracteres mais comumente usado em computadores hoje é Unicode, um padrão global para codificação de caracteres. Internamente, os aplicativos do Windows usam a implementação UTF-16 do Unicode. Em UTF-16, a maioria dos caracteres são identificados por códigos de dois bytes. Os caracteres suplementares menos usados são cada um representado por um par substituto, que é um par de códigos de dois bytes. Para obter mais informações, consulte Substitutos e Caracteres Suplementares.
Alguns aplicativos do Windows devem funcionar com os conjuntos de caracteres mais antigos nativos do Windows Me/98/95. páginas de código do Windows permitir que seu aplicativo trabalhe com esses conjuntos de caracteres. Estes conjuntos de caracteres podem ser divididos em:
- Conjuntos de caracteres de byte único (SBCS). Em um SBCS, cada caractere é identificado por um valor de um byte de largura.
- Conjuntos de caracteres multibyte, em particular o conjuntos de caracteres de byte duplo (DBCS). Conjuntos de caracteres multibyte fornecem um meio de representar o grande número de caracteres em muitos idiomas asiáticos.
Para obter mais informações, consulte os seguintes tópicos:
- páginas de código
- conjuntos de caracteres de byte duplo
- conjuntos de caracteres de byte único
- Substitutos e Caracteres Suplementares
- Unicode
Tópicos relacionados