Freigeben über


Zeichensätze

Ein "Zeichensatz" ist eine Zuordnung von Zeichen zu ihren identifizierenden Codewerten. Der zeichensatz, der heute am häufigsten auf Computern verwendet wird, ist Unicode-, ein globaler Standard für die Zeichencodierung. Intern verwenden Windows-Anwendungen die UTF-16-Implementierung von Unicode. In UTF-16 werden die meisten Zeichen durch Zwei-Byte-Codes identifiziert. Die weniger häufig verwendeten Zusatzzeichen werden jeweils durch ein Ersatzpaar dargestellt, bei dem es sich um ein Paar aus zwei Bytecodes handelt. Weitere Informationen finden Sie unter Surrogates und Ergänzungszeichen.

Einige Windows-Anwendungen müssen mit den älteren Zeichensätzen arbeiten, die für Windows Me/98/95 nativ sind. Windows-Codeseiten es Ihrer Anwendung ermöglichen, mit diesen Zeichensätzen zu arbeiten. Diese Zeichensätze können unterteilt werden in:

  • Single-Byte-Zeichensätze (SBCS). In einem SBCS wird jedes Zeichen durch einen Wert 1 Byte breit identifiziert.
  • Multibyte-Zeichensätze, insbesondere die Double-Byte-Zeichensätze (DBCS). Multibyte-Zeichensätze bieten eine Möglichkeit, die große Anzahl von Zeichen in vielen asiatischen Sprachen darzustellen.

Weitere Informationen finden Sie in den folgenden Themen:

Über Unicode- und Zeichensätze