java

데이터 타입(문자형)

병호네 2024. 4. 8. 17:45

★ 학습 목표★

1. byte 와 bit 란 뭘까?

2. char 자료형의 이해

3. 인코딩과 디코딩이란 뭘까?

 

1. byte 와 bit 란 뭘까?

Bit (비트):

  • 컴퓨터의 최소 데이터 단위입니다.
  • 이진수(0 또는 1)로 표현되는 정보의 단위입니다.
  • 1비트는 2가지의 상태를 나타낼 수 있습니다. 예를 들어, 스위치가 켜져있는지(1) 꺼져있는지(0)를 나타낼 수 있습니다.
  • 컴퓨터의 모든 데이터와 명령은 이진수로 표현되며, 이진수의 각 자리는 비트에 해당합니다.

Byte (바이트):

  • 8개의 비트로 이루어진 데이터 단위입니다.
  • 1바이트는 일반적으로 컴퓨터에서 문자, 숫자, 기호 등의 하나의 문자를 나타내는 데 사용됩니다.
  • 예를 들어, 영문 알파벳 한 글자는 보통 1바이트로 표현됩니다.

bit는 정보의 최소 단위이고, byte는 데이터를 저장하고 표현하는 데 사용되는 더 큰 단위입니다

!핵심 정리! - 8비트는 1바이트, bit 는 물리적인 단위, byte는 논리적인 단위이다 라고 기억합시다.

 

2. char 자료형의 이해

잠깐! 고민해보기

문자 자료형도 데이터인데 위에서 컴퓨터의 모든 데이터와 명령은 이진수로 표현된다고 배웠는데 문자는 컴퓨터에 어떻게 저장되고 표현이 될까?

 

컴퓨터에서 문자를 표현하고 처리하기 위해 문자표가 사용됩니다. (미리 만들어 놓음)

 

문자표는 ASCII (American Standard Code for Information Interchange), Unicode, UTF-8, UTF-16 등의 형식으로 구성될 수 있습니다.

  • ASCII는 초기에 사용되었던 문자 인코딩 방식 중 하나로, 주로 미국에서 사용되었습니다.
  • Unicode는 전 세계의 모든 문자를 나타내기 위해 설계된 표준 문자 인코딩 시스템입니다.
  • UTF-8은 Unicode의 문자를 효율적으로 인코딩하는 방식 중 하나입니다. 1바이트에서 4바이트까지 다양하게 문자를 표현할 수 있음
  • UTF-16 은 2바이트로 문자를 표현

 

 

3. 인코딩과 디코딩이란 뭘까?

인코딩이란?

  • 이진수를 문자형으로 바꾸는 과정을 일반적으로 "인코딩(Encoding)"이라고 합니다. 인코딩은 정보를 특정 형식으로 변환하는 과정을 의미하며, 주로 컴퓨터에서 데이터를 다룰 때 사용됩니다.

 

디코딩이란?

  • 문자를 이진수로 변환하는 과정은 일반적으로 "디코딩(Decoding)"이라고 합니다. 디코딩은 인코딩의 반대 과정으로, 정보를 특정 형식에서 원래의 형식으로 변환하는 과정을 의미합니다.