기하학적 패턴 벡터를 이용한 한.영 글꼴 문자인식

Hansel and English Text Font Recognition Using Geometrical Pattern Vector

  • 석영수 (동명정보대학교 정보통신공학과) ;
  • 홍창희 (동명정보대학교 정보통신공학과) ;
  • 조정락 (동명정보대학교 정보통신공학과) ;
  • 강기섭 (동명정보대학교 정보통신공학과) ;
  • 민종규 (동명정보대학교 정보통신공학과) ;
  • 이응주 (동명정보대학교 정보통신공학과)
  • 발행 : 2001.09.01

초록

본 논문에서는 문서 위의 문자를 Off-Line방식으로 컴퓨터에 저장할 수 있도록 기하학적 패턴 벡터를 이용하여 한·영문자 및 글꼴을 인식하는 알고리즘을 제안하였다. 일반적으로 문서에서는 여러 가지 글꼴에 따라 글자의 형태가 다르므로 대표적인 한·영 세 가지 글꼴을 기하학적 패턴(Geometrical Pattern Vector)을 이용하여 크기와 이동에 인식하도록 하였다. 이진 입력 한영혼용 영상에서 잡음을 제거하고 수평·수직 투영 기법을 이용하여 한 문자를 분할하여 문자의 폭에 따라 기하학적 패턴을 추출한다. 추출한 패턴은 각 합계를 계산하여 기준 패턴 합계와 비교한 후 기준 패턴 문자와 글꼴을 인식하게 된다. 마지막으로 제안한 알고리즘의 성능을 평가하기 위해 크기, 이동 변형이 있는 대표적인 한·영 글꼴(신명조, 궁서, 고딕)체와 영어 Time New Roman체를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 원형 패턴 알고리즘보다 문자인식률과 글꼴 그리고 영어의 대·소문자를 구별하는 우수함을 보였다.

키워드