A Study on the Hangul Recognition Using Hough Transform and Subgraph Pattern

Hough Transform과 부분 그래프 패턴을 이용한 한글 인식에 관한 연구

  • 구하성 (한서대학교 컴퓨터과학과) ;
  • 박길철 (한남대학교 멀티미디어대학)
  • Published : 1999.03.01

Abstract

In this dissertation, a new off-line recognition system is proposed using a subgraph pattern, neural network. After thinning is applied to input characters, balance having a noise elimination function on location is performed. Then as the first step for recognition procedure, circular elements are extracted and recognized. From the subblock HT, space feature points such as endpoint, flex point, bridge point are extracted and a subgraph pattern is formed observing the relations among them. A region where vowel can exist is allocated and a candidate point of the vowel is extracted. Then, using the subgraph pattern dictionary, a vowel is recognized. A same method is applied to extract horizontal vowels and the vowel is recognized through a simple structural analysis. For verification of recognition subgraph in this paper, experiments are done with the most frequently used Myngjo font, Gothic font for printed characters and handwritten characters. In case of Gothic font, character recognition rate was 98.9%. For Myngjo font characters, the recognition rate was 98.2%. For handwritten characters, the recognition rate was 92.5%. The total recognition rate was 94.8% with mixed handwriting and printing characters for multi-font recognition.

본 논문에서는 부분 그래프 패턴과 신경망을 이용한 새로운 한글 오프라인 인식 시스템을 제안하였다. 문자를 입력으로 받아 세선화를 행한 후 위치에 관한 잡음 제거 기능을 갖는 균형화를 수행하고 인식단의 첫번째 단계에서 순환 성분을 추출하고 인식한다. 부블럭 HT 공간에서 끝점, 굴곡점, 분기점의 특징점을 추출하고 추출된 특징점 사이의 관계를 조사하여 부분 그래프 패턴을 구성한다. 종모음이 올 수 있는 구역을 할당하고 종모음 후보점을 추출하여 미리 조사된 부분 그래프 패턴 사전과 비교하여 종모음을 추출한다. 같은 방법으로 횡모음을 추출한 후 간단한 구조 해석적 방법으로 모음을 인식한다. 본 논문의 성능비교를 위하여 실험은 활자체의 경우 가장 많이 쓰이는 명조체와 고딕체 그리고 필기체를 대상으로 한다. 고딕체의 경우 인식율 98.9%, 명조체의 경우 인식율 98.2%, 필기체의 경우 92.5% 이었다. 다중 자형 인식을 위하여 필기체와 활자체의 구분 없이 구한 전체 시스템의 인식율은 94.8% 이었다.

Keywords