文字セット

[アーティクル]
03/12/2025

"文字セット" は、文字と識別コード値のマッピングです。現在のコンピューターで最もよく使用されている文字セットは、文字エンコードのグローバル標準である Unicode です。内部的には、Windows アプリケーションは Unicode の UTF-16 実装を使用します。 UTF-16 では、ほとんどの文字は 2 バイトコードで識別されます。使用頻度の低い補助文字は、それぞれサロゲートペア (2 バイトコードのペア) で表されます。詳細については、「サロゲートと補助文字の」を参照してください。

一部の Windows アプリケーションは、Windows Me/98/95 にネイティブである以前の文字セットで動作する必要があります。 Windows コードページ、アプリケーションでこれらの文字セットを操作できます。これらの文字セットは、次のように分割できます。

1 バイト文字セット (SBCS)。 SBCS では、各文字は 1 バイト幅の値で識別されます。
マルチバイト文字セット、特に 2 バイト文字セット (DBCS)。マルチバイト文字セットは、多くのアジア言語で多数の文字を表す手段を提供します。

詳細については、次のトピックを参照してください。

Unicode と文字セットのについて

次の方法で共有

文字セット

フィードバック

その他のリソース

次の方法で共有

文字セット

関連トピック

フィードバック

その他のリソース