공부하는 남자   



  • Key log

  • 공부 하는 남자
    검색 하는 남자

  • Log in out

  • 관리자

  • 편집

  • 글 쓰기

  • Link
  • Home
  • 유니 코드와 아스키 코드 그리고 컴퓨터 언어 0과1의 원리

    2020. 12. 20. 22:21   코딩문자 배우기

    아스키 코드는 미국의 컴퓨터에 기록 하는 정보 교환 부호를 나타 내는 언어를 말하며 세계 웹표준 기호를 나타내는 유니코드 도표에서 첫구간에 나타 내는 기본 판 입니다.

    유니코드 는 전세계의 각 나라별 컴퓨터에 사용하는 부호를 국가 별로 구간을 정한 규격표로서 국제 표준규격을 정하는 W3C라는 기구에 의해서 조정 되고 정해진 규격 입니다.

    특별히 컴퓨터 개발국인 미국은 유니코드 0부터 128까지 의 구간을 할당 해  주고 있지요

    우리 대한민국은 유니코드의 AC00(가)~D7A3(힣)와 공백 12개를 더한 D7AF 까지 구간을 할당 받고 있으며 유니코드의 3바이트 구간을 배정 받고 있지요

    한글에 배당된 갯수를 계산 해보면 AC00은 10×16/3+12×16/2+0×16+0=40,960+3072=44,032가 되고 D7AF 는 13×16/3+7×16/2+10×16+15=53,248+1,792+160+15=55,215 가 됩니다.
    (위에서 16/3 이렇게 표시를 한 것 은 16을 3번 곱한 승수 표시 입니다.)

    십육진수 표기법

    0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F (A=10)(B=11)(C=12)(D=13)(E=14)(F=15)

    10 11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1F 20 21 22 23 24 25 26 27 28 29  2A. . . . . 

    이런식으로 나열이 됩니다.

    계산 해보면 55,215-44,032=11,183개의 코드를 할당 받고 있지요

    11,183개 인데 그중 공백 12개를 빼면 11,172개 가 한글의 가지 수 라는걸 알 수가 있는데요 정말 어마 어마한 경우의 수를 느끼게 됩니다.

    컴퓨터는 이진법 만으로 전달 되는데요 전압을 흘렀다 끊었다 하는 두가지 방식 으로 전기가 흐를 때는 1 끊어질 때는 0 으로 표기 되는 마치 초기 원시 암호 전송 방식인 모르스 부호를 전송 하는 방식을 반도체인 실리콘에 전기를 흘렸다 끊었다 하는 이진법 방식으로 회로를 설계 해서 전달 하고 다시 이것은 디스플레이에서 화면으로 바꾸어 나타 내는 방식으로 코딩 하게 되는 것이 라고 할 수 있습니다.

    만약 "가" 라는 글자를 자판에 탁 쳤을때 실리콘 반도체에서는 AC00(16) 십진수 44,032 이것을 이진수로 계산 하면 1 2 4 8 16 32 64 128 256 512 1,024 2,048 4,096 8,192 16,384 32,768 이 자리에 대응 하면 44,032-32,768=11,264-8192=3072-2048=1024-1024=0 여기서 대응 하는 자리는 1 대응 하지 않은 자리는 0으로 표시 해주면 

    32768=1  16384=0  8192=1  4096=0  2048=1  1024=1  아래 나머지의 수는 모두 0이 됩니다.

    그러므로 역으로 표시를 해 보면 1010110000000000 그리고 이것을 4자리수 로 묶어서 나타내면[1010][1100][0000][0000]이것을 다시 유니코드의 3바이트 구간의 도표에 대입 하면 아래 와 같이 나타 낼수 있습니다.

    [11101010][10110000][10000000]

    이렇게 이진법으로 표기가 되는데요 이 것을 반도체 에다 레이져로 전기를 흘렸다 끊었다 하도록 코딩을 해주면 가 라는 글자를 전송 하게 되는 것 입니다.




    T,back:     Comment: