본문 바로가기

C++

아스키코드와 유니코드

728x90

부호화란?

문자를 컴퓨터에 저장하기 위해서는 문자를 부호화해야 한다.

예를 들어, 문자 'a'를 아스키코드로 부호화하면 0x61이 된다.

 


아스키코드

  • 1960년대 미국에서 정의한 표준 부호 체계
  • 7비트만을 사용, 1비트는 에러 검출용 parity bit
  • Single Byte Character Set(SBCS)
  • 0~127의 값을 가짐
  • 7비트밖에 사용하지 않기에 한글과 같은 다른 언어를 표현하기에는 부족 ➡️ ANSI 코드의 등장

유니코드

  • 1991년대 최초 발표된 표준 부호 체계
  • Wide Byte Character Set(WBCS)
  • UTF-8, UTF-16, UTF-32 등 다양한 인코딩 방식이 있으며, 가장 널리 사용되는 것은 UTF-8.
  • UTF-8
    • 1~4바이트를 사용.
    • Grapheme ➡️ Code Point ➡️ Bytes
    • Grapheme =🫰🏾 / Code Point =🫰, 🟫 / Bytes = 8-bytes
  • UTF-32
    • 4바이트를 사용

'C++' 카테고리의 다른 글

프로그래밍 언어의 종류  (0) 2024.03.01
Data types  (0) 2024.02.24
C++ 주석 쓰는 법  (1) 2024.02.24
C++ Standard Library란  (0) 2024.02.24
build, clean, rebuild, compile, run/start  (0) 2024.02.19