728x90
부호화란?
문자를 컴퓨터에 저장하기 위해서는 문자를 부호화해야 한다.
예를 들어, 문자 'a'를 아스키코드로 부호화하면 0x61이 된다.
아스키코드
- 1960년대 미국에서 정의한 표준 부호 체계
- 7비트만을 사용, 1비트는 에러 검출용 parity bit
- Single Byte Character Set(SBCS)
- 0~127의 값을 가짐
- 7비트밖에 사용하지 않기에 한글과 같은 다른 언어를 표현하기에는 부족 ➡️ ANSI 코드의 등장
유니코드
- 1991년대 최초 발표된 표준 부호 체계
- Wide Byte Character Set(WBCS)
- UTF-8, UTF-16, UTF-32 등 다양한 인코딩 방식이 있으며, 가장 널리 사용되는 것은 UTF-8.
- UTF-8
- 1~4바이트를 사용.
- Grapheme ➡️ Code Point ➡️ Bytes
- Grapheme =🫰🏾 / Code Point =🫰, 🟫 / Bytes = 8-bytes
- UTF-32
- 4바이트를 사용
'C++' 카테고리의 다른 글
프로그래밍 언어의 종류 (0) | 2024.03.01 |
---|---|
Data types (0) | 2024.02.24 |
C++ 주석 쓰는 법 (1) | 2024.02.24 |
C++ Standard Library란 (0) | 2024.02.24 |
build, clean, rebuild, compile, run/start (0) | 2024.02.19 |