Conjuntos de caracteres
Um "conjunto de caracteres" é um mapeamento de caracteres para seus valores de código de identificação. O conjunto de caracteres mais comumente usado em computadores atualmente é Unicode, um padrão global para codificação de caracteres. Internamente, os aplicativos do Windows usam a implementação UTF-16 do Unicode. No UTF-16, a maioria dos caracteres é identificada por códigos de dois bytes. Os caracteres suplementares menos usados são representados por um par substituto, que é um par de códigos de dois bytes. Para obter mais informações, consulte substitutos e caracteres suplementares.
Alguns aplicativos do Windows devem trabalhar com os conjuntos de caracteres mais antigos que são nativos do Windows Me/98/95. páginas de código do Windows permitir que seu aplicativo funcione com esses conjuntos de caracteres. Esses conjuntos de caracteres podem ser divididos em:
- conjuntos de caracteres de byte único (SBCS). Em um SBCS, cada caractere é identificado por um valor de um byte de largura.
- Conjuntos de caracteres multibyte, em particular o conjuntos de caracteres de byte duplo (DBCS). Os conjuntos de caracteres multibyte fornecem um meio para representar o grande número de caracteres em muitos idiomas asiáticos.
Para obter mais informações, consulte os seguintes tópicos:
- páginas de código
- conjuntos de caracteres de bytes duplos
- conjuntos de caracteres de byte único
- substitutos e caracteres suplementares
- Unicode
Tópicos relacionados