The qDecoder Project

Written by bucket Hits: 69 , Lines: 11
한글 질문다시 합니다
저번에 했던 한글 관련 질문다시 합니다 저번에 대답하신분 대답은 고맙지만 제가 질문한 답이 아니거든요 다시 여러모로 연구해본뒤 다시 질문드리는건데요
예를 들어보죠 html문서에서 임의의 폼으로 (인풋은 텍스트라고 가정해보죠) 어떤 스트링이 넘어왔다고 생각해 봅시다 그럼 이스트링이 한글을 일부 포함하고 있다고 해봅시다 그럼 그부분은 두바이트가 할당되겠죠
(str = "a가" 라면 str[0] = ‘a’ str[1] = -80 str[2] = -95 str[3]=’’ 입니다
일부러 한글이 할당된 부분은 인티저 값으로 써줬읍니다 저번에 대답해주신대로 unsigned character로한다면 2의 보수를 고려한 정수값으로 바뀌겠죠 근데 그건 중요한게 아닌데 –;)  어쨌던 이렇게 저장이 된다면 이를 가지고 조작을 하면 되겠죠 그런데 만약 저한글이 ‘가’ 가아닌 완성형 코드에 없는 ‘ㅆ ㅜ ㅔ ㅆ’ (이 게시판에서는 깨지기때문에 한칸씩 띄어썼습니다 원래는 붙여서 한글자로 생각해주세요) 라면 얘기가 틀려집니다 이걸 제가 시험해본바로는
str[0]=’a’ str[1]=38 str[2]=35 str[3]=53 str[4]=48 str[5]=51 str[6]=53 str[7]=50 str[8]=59 str[9]=’’이 됩니다 정말 황당하죠–;
무려 한글자에 8바이트가 소요됩니다 –; 이걸 다시 써보면 & # 5 0 3 5 2 ; 이렇게 되거든요 –; 이게 참 황당한데 이걸 어떻게 해결해야하는지 –;
혹시 누가 이거 매칭되는 표라도 가진분있나요? 그거라도 있으면 어떻게 해보겠는데 답답하네요
왜 이렇게 디코딩이 되는지 모르겠네요
참고로 & # 5 0 3 5 2 ; (이것도 원래는 전부 붙여서 쓰는겁니다) 이걸 아무 html문서에 써보면 이해가 안가지만 원래 한글이 나옵니다 심심하신분들은
& # _ _ _ _ _ ;(다시 말하지만 원래 붙여쓰는겁니다–;) 에서 _부분을 적당한 숫자로 써주면 그에 해당하는 한글이나 한문이 출력됩니다–; 아마 무슨 표나 바꾸는 로직이 있을텐데 찾을 수가 없네요(생각해보면 게시판에서 이런 문자들 많이 보지않았나요? 한글이 깨졌다고 생각했던것같은데 그게 문제가 아닌것같군요)
Prev : Re: gdbm락에 관한 질문입니다
Next : 업로드 에러..
April 24, 2002 (23:37) from 210.205.6.12
CrazyWWWBoard 98 Professional Edition II
Modify Delete Post Reply Forward List

[Home] [About] [Examples] [Changes] [Download] [Install] [Reference] [Bugs] [Q&A;]
Netchestra bizWorker