文字セット
"文字セット" は、文字と識別コード値のマッピングです。 現在のコンピューターで最もよく使用されている文字セットは、文字エンコードのグローバル標準である Unicode です。 内部的には、Windows アプリケーションは Unicode の UTF-16 実装を使用します。 UTF-16 では、ほとんどの文字は 2 バイト コードで識別されます。 使用頻度の低い補助文字は、それぞれサロゲート ペア (2 バイト コードのペア) で表されます。 詳細については、「サロゲートと補助文字の」を参照してください。
一部の Windows アプリケーションは、Windows Me/98/95 にネイティブである以前の文字セットで動作する必要があります。 Windows コード ページ 、アプリケーションでこれらの文字セットを操作できます。 これらの文字セットは、次のように分割できます。
- 1 バイト文字セット (SBCS)。 SBCS では、各文字は 1 バイト幅の値で識別されます。
- マルチバイト文字セット、特に 2 バイト文字セット (DBCS)。 マルチバイト文字セットは、多くのアジア言語で多数の文字を表す手段を提供します。
詳細については、次のトピックを参照してください。
- コード ページの
- 2 バイト文字セット
- 1 バイト文字セット
- サロゲートと補助文字の
- Unicode の
関連トピック
-
Unicode と文字セットの について