Conjuntos de caracteres

Artigo
03/12/2025

Um "conjunto de caracteres" é um mapeamento de caracteres para seus valores de código de identificação. O conjunto de caracteres mais comumente usado em computadores atualmente é Unicode, um padrão global para codificação de caracteres. Internamente, os aplicativos do Windows usam a implementação UTF-16 do Unicode. No UTF-16, a maioria dos caracteres é identificada por códigos de dois bytes. Os caracteres suplementares menos usados são representados por um par substituto, que é um par de códigos de dois bytes. Para obter mais informações, consulte substitutos e caracteres suplementares.

Alguns aplicativos do Windows devem trabalhar com os conjuntos de caracteres mais antigos que são nativos do Windows Me/98/95. páginas de código do Windows permitir que seu aplicativo funcione com esses conjuntos de caracteres. Esses conjuntos de caracteres podem ser divididos em:

conjuntos de caracteres de byte único (SBCS). Em um SBCS, cada caractere é identificado por um valor de um byte de largura.
Conjuntos de caracteres multibyte, em particular o conjuntos de caracteres de byte duplo (DBCS). Os conjuntos de caracteres multibyte fornecem um meio para representar o grande número de caracteres em muitos idiomas asiáticos.

Para obter mais informações, consulte os seguintes tópicos:

sobre conjuntos de caracteres e Unicode

Compartilhar via

Conjuntos de caracteres

Comentários

Recursos adicionais

Compartilhar via

Conjuntos de caracteres

Tópicos relacionados

Comentários

Recursos adicionais