DOI QR코드

DOI QR Code

Support on Ideograph Characters Search of Unicode Based Information System

정보 시스템의 유니코드 기반 한자 검색 지원

  • 윤소영 (국사편찬위원회 사료연구위원)
  • Published : 2007.12.31

Abstract

Unicode Han ideograph character set differed from the our principle of the phonetic value ordering in that it followed the principle of KangXi radical-stroke ordering of the characters. Therefore, information system should support ideograph search on precise analysis of materials which consist of korean character (hangul) and ideograph character (hanja). History Information system has been maintaining Hanja(Chinese Character) to Hangul Dictionary, Terminology Dictionary for composition, borrowing, non-ideographic principles, Variant Forms Dictionary, and Recently discovered Chinese Characters List.

현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출 한자목록을 지원하고 있다.

Keywords

References

  1. 강대걸. 2005. 한국역사정보통합시스템 구축 및 포털시스템 업그레이드 사업검색엔진 사전테이블 업그레이드연구. 국사편찬위원회
  2. 기술표준원, '국제문자부호계 KS규격의 국제규격부합화 연구', 한국표준협회, 2000
  3. 류범종, 최윤수. 2004. 정보검색관리시스템 KRISTAL-2002. 지식정보인프라 제 15호: 36-40
  4. 문자코드연구센터. 2004. '신출한자의 처리와 국제 표준화', 2004년 문자코드연구센터 워크숍
  5. 박종우. 2007. '한자 국제 표준화와 인명용한자', 문자코드연구센터 소식 19 : 1-3
  6. 산업표준심의회 2004 ' 정보 교환용 부호계(한글 및 한자) KSX 1001', 한국표준협회
  7. 신상현. 2004. '우리나라 固有漢字조사 보고(1)', 문자코드연구센터 소식 14 : 7-8
  8. 안대혁, 박영배. 2007. 유니코드 환경에서의 올바른 한글 정규화를 위한 수정방안, 정보과학회논문지, 소프트웨어 및 응용 제34권 제2호: 169-177
  9. 이규옥. 2005. '한적자료 DB구축사업과 이체자 정리', 문자코드연구센터 소식15 : 2-4
  10. 정우봉. 2005. 21세기세종계획문자코드표준화 연구. 국립국어원
  11. 조순영. 2003. 학술 데이터베이스의유니코드 변환 적용에 관한 연구. 한국교육학술정보원.
  12. 주리정. 2001. '유니코드의 구조와 문제점', 한국정보관리학회제8회 학술대회 논문집, 23-28
  13. 홍윤표, '한글코드에 관한 연구', 국립국어연구원, 1995
  14. Allen J.D., Joe Baker, Richard Cook ,Mark Davis, Michael Everson, Asmus Freytag, Jonh H. Jenkins, Mike Ksar, Rick McGowan, Lisa Moore, Eric Muller, Markus Scherer, Michel Suignard, and Ken Whistler. 2007 The Unicode Standard 5.0, Unicode Consortium, Addison-Wesley
  15. Korpela, Jukka K. 2006. Unicode Explained, O Reilly