다음을 통해 공유


문자 집합

"문자 집합"은 식별 코드 값에 문자를 매핑하는 것입니다. 오늘날 컴퓨터에서 가장 일반적으로 사용되는 문자 집합은 문자 인코딩의 전역 표준인 유니코드 . 내부적으로 Windows 애플리케이션은 유니코드의 UTF-16 구현을 사용합니다. UTF-16에서는 대부분의 문자가 2 바이트 코드로 식별됩니다. 덜 일반적으로 사용되는 보조 문자는 각각 서로게이트 쌍(2 바이트 코드 쌍)으로 표시됩니다. 자세한 내용은 서로게이트 및 보조 문자참조하세요.

일부 Windows 애플리케이션은 Windows Me/98/95에 네이티브인 이전 문자 집합으로 작동해야 합니다. Windows 코드 페이지를 애플리케이션이 이러한 문자 집합으로 작업할 수 있도록 허용합니다. 이러한 문자 집합은 다음으로 나눌 수 있습니다.

  • SBCS(single-byte 문자 집합)입니다. SBCS에서 각 문자는 1 바이트 너비 값으로 식별됩니다.
  • 멀티바이트 문자 집합, 특히 DBCS()의 더블바이트 문자 집합입니다. 멀티바이트 문자 집합은 많은 아시아 언어로 많은 수의 문자를 나타내는 수단을 제공합니다.

자세한 내용은 다음 항목을 참조하세요.

유니코드 및 문자 집합 대한