DOI QR코드

DOI QR Code

Recognition of Korean Text in Outdoor Signboard Images Using Directional Feature and Fisher Measure

방향성분 특징과 Fisher Measure를 이용한 간판영상 한글인식

  • 임준식 (전남대학교 전자컴퓨터공학부) ;
  • 김수형 (전남대학교 전자컴퓨터공학부) ;
  • 이귀상 (전남대학교 전자컴퓨터공학부) ;
  • 양형정 (전남대학교 전자컴퓨터공학부) ;
  • 이명은 (전남대학교 전자컴퓨터공학부)
  • Published : 2009.06.30

Abstract

In this paper, we propose a Korean character recognition method from outboard signboard images. We have chosen 808 classes of Korean characters by an analysis of frequencies of appearance in a dictionary of signboard names. The proposed method mainly consists of three steps: feature extraction, rough classification, and coarse classification. The first step is to extract a nonlinear directional segments feature, which is immune to the distortion of character shapes. The second step computes an ordered set of 10 recognition candidates using a minimum distance classifier. The last step reorders the recognition candidates using a Fisher discriminant measure. As experimental results, the recognition accuracy is 80.45% for the first choice, and 93.51% for the top five choices.

본 논문은 모바일 폰 기반의 간판 영상내 한글 문자인식에 관한 연구로써 인식 대상은 간판영상에서 추출된 상호명으로 하였고 인식대상 문자 수는 상호명 빈도수 기반 808자로 한정하였다. 인식과정은 특징 추출, 대분류, 상세 분류로 구성되고 특징 추출과정에서는 문자영상의 크기, 잡음 및 왜곡에 강건한 비선형 방향성분 특징을 이용하였고 대분류 과정에서는 추출된 특징과 인식 대상문자에 대하여 최소거리 분류를 수행하고 10순위까지의 후보 문자를 추출하였다. 상세 분류 과정에서는 Fisher discriminant measure 이용하여 대분류에서 발생 할 수 있는 오인 식 결과를 보완하였다. 실험결과 1순위 인식률은 80.45%이고 5순위까지의 누적 인식률은 93.51%를 보였다.

Keywords

References

  1. I. Haritaoglu, 'Scene text extraction and translation for handheld devices,' Proc. of the IEEE Conference on Computer Vision and Pattern Recognition, Vol.2, pp.408-413, 2001 https://doi.org/10.1109/CVPR.2001.990990
  2. C. Thillou, B. Gosselin, 'Character Segmentation-by- Recognition Using Log-Gabor Filters', Proc. of IAPR International conference on Pattern Recognition, pp.901-904, 2006 https://doi.org/10.1109/ICPR.2006.362
  3. C. Thillou, B. Gosselin, 'Color binarization for complex camera-based images,' Proc. Electronic Imaging, pp.301-308, 2005 https://doi.org/10.1117/12.586618
  4. C. Thillou, B. Gosselin, 'Color Text Extraction from Camera-based Images the Impact of the Choice of the Clustering Distance,' Proc. of IEEE International Conference on Documents Analysis and Recognition, pp.312-316, 2005 https://doi.org/10.1109/ICDAR.2005.76
  5. C. THILLOU, 'Natural Scene Text Understanding', Vision Systems, Segmentation and Pattern Recognition, Ch.16, pp.307-333, 2007
  6. 정인숙, 함대성, 오일석, '웹 이미지의 텍스트 추출을 위한 색분산 방법의 실험적 평가', 영상처리 및 이해에 관한 워크샵, p.36, 2008
  7. 김지훈, 이택헌, 김기웅, 김진형, '상향식 접근 방법을 사용한 강인한 간판 인식', 한국컴퓨터종합 학술대회 논문집, 제34권,제1호, pp.234-235, 2007
  8. J. Zhang, X. Chen, J. Yang, and A. Waibel, 'A PDA-based Sign Translator,' Proceedings of the Fourth IEEE International Conference on Pattern Recognition, pp.216-219, Oct., 2002 https://doi.org/10.1109/ICMI.2002.1166996
  9. Y. Watanabe, Y. Okada, Y. B. Kim, and T. Takeda, 'Translation camera,' Proceedings of International Conference on Pattern Recognition, Vol.1, pp.613-617, 1998 https://doi.org/10.1109/ICPR.1998.711218
  10. C. Li, X. Ding, and Y. Wu, 'Automatic text location in natural scene images,' Proceedings of International Conference on Document Analysis and Recognition, pp.1069- 1073, 2001 https://doi.org/10.1109/ICDAR.2001.953950
  11. http://www.kosef.re.kr/bbs/
  12. 허기수, 오일석, '간판인식 연구를 위한 간판영상 데이터베이스,' 한국 정보과학회 춘계 학술발표회, 2005.7.6
  13. 박현일, 김수형, '칼라 군집화 및 비등방성확산필터를 이용한 저해상도 영상에서의 숫자열 인식,' 제22회 한국정보처리학회 추계학술발표대회 논문집, 제11권 제2호, pp.839-842, 2004년 11월
  14. 오일석, Ching Y. Suen, '광학 문자 인식을 위한 거리 특징,' 한국정보과학회논문지(B), 제25권 제7호, pp.1028-1043, 1998 년 7월
  15. M. Shridhar, A. Badreldin. 'A high-accuracy syntactic recognition algorithm for handwritten numerals,' IEEE Tr. SMC 15(1), pp.152-158, 1985
  16. T. Pavlidis, F. Ali. 'Computer recognition of handwritten numerals by polygonal approximations,' IEEE Tr. SMC 5(6), pp.610-614, 1975
  17. Y. Le Cun, O. Matan, B. Boser, J.S. Denker, D. Henderson, R.E. Howard, W. Hubbard, L.D. Jackel, H.S. Baird, 'Handwritten Zip code recognition with multilayer networks,' Proc. ICPR'90, pp.35-40, 1990 https://doi.org/10.1109/ICPR.1990.119325
  18. J. Cao, M. Ahmadi, M. Shridhar, 'A hierarchical neural network architecture for handwritten numeral recognition,' Pattern Recognition, 30(2), pp.289-294, 1997 https://doi.org/10.1016/S0031-3203(96)00069-6
  19. N.W. Strathy, C.Y. Suen, 'A new system for reading handwritten ZIP codes,' Proc. ICDAR, pp.74-77, Montreal, Canada, 1995
  20. J.H. Park, T. N. Dinh, G.S. Lee, 'Binarization of Text Region based on Fuzzy Clustering and Histogram Distribution in Signboards', Proc. WORLD ACADEMY OF SCIENCE, ENGINEERING AND TECHNOLOGY, Vol.33, pp.85-90, 2008
  21. 김의철, 김수형, 양형정 오상욱, '연결 요소 분석에 의한 간판영상의 문자 분할,' 한국멀티미디어학회 춘계 학술발표회, 2008년 5월