Teckenuppsättningar
En "teckenuppsättning" är en mappning av tecken till deras identifierande kodvärden. Den teckenuppsättning som används oftast på datorer i dag är Unicode, en global standard för teckenkodning. Internt använder Windows-program UTF-16-implementeringen av Unicode. I UTF-16 identifieras de flesta tecken med två byteskoder. De mindre vanliga extra tecknen representeras var och en av ett surrogatpar, vilket är ett par med två bytekoder. Mer information finns i surrogater och tilläggstecken.
Vissa Windows-program måste fungera med äldre teckenuppsättningar som är inbyggda i Windows Me/98/95. Windows-kodsidor tillåta att programmet fungerar med dessa teckenuppsättningar. Dessa teckenuppsättningar kan delas in i:
- teckenuppsättningar med en byte (SBCS). I en SBCS identifieras varje tecken med ett värde som är ett byte brett.
- Flerbytesteckenuppsättningar, särskilt teckenuppsättningar med dubbla byte (DBCS). Flerbytesteckenuppsättningar ger ett sätt att representera det stora antalet tecken på många asiatiska språk.
Mer information finns i följande avsnitt:
- kodsidor
- teckenuppsättningar med dubbla byte
- teckenuppsättningar med en byte
- surrogater och tilläggstecken
- Unicode
Relaterade ämnen