Development of Input System for Digitalizing Handwritten Hanja Historical Documents

필기 한자 고문서의 디지털 라이브러리화를 위한 입력 시스템 개발

  • 장만대 (한국과학기술원 전자전산학과) ;
  • 김민수 (한국과학기술원 전자전산학과) ;
  • 이택헌 (한국과학기술원 전자전산학과) ;
  • 김진형 (한국과학기술원 전자전산학과) ;
  • 곽희규 ((주)동방 SnC)
  • Published : 2003.10.01

Abstract

본 논문에서는 필기 한자로 쓰여진 고문서를 보다 효율적으로 디지털 라이브러리화하기 위한 입력 방법을 제안한다. 제안한 입력 방법은, 문자 인식 방법과 수작업을 병행하는 방법으로서, 인식 및 기각 방법을 사용하여 유사한 글자들을 자동 군집화한 후, 수작업으로 교정 및 검증을 거쳐 최종 입력하는 방식이다. 한국학 고문서인 승정원일기를 대상으로 한 실험에서, 제안한 방법이 높은 정확률과 낮은 기각 비율을 보임으로써, 기존의 수작업 입력 방법을 대체할 경우 상당한 시간 및 노동력의 절감을 가져올 것으로 기대한다.

Keywords