Video character recognition improvement by support vector machines and regularized discriminant analysis

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선

  • Lim, Su-Yeol (Department of Statistics, Chonnam National Univisity) ;
  • Baek, Jang-Sun (Department of Statistics, Chonnam National Univisity) ;
  • Kim, Min-Soo (Department of Statistics, Chonnam National Univisity)
  • Received : 2010.05.11
  • Accepted : 2010.07.08
  • Published : 2010.07.31

Abstract

In this study, we propose a new procedure for improving the character recognition of text area extracted from video images. The recognition of strings extracted from video, which are mixed with Hangul, English, numbers and special characters, etc., is more difficult than general character recognition because of various fonts and size, graphic forms of letters tilted image, disconnection, miscellaneous videos, tangency, characters of low definition, etc. We improved the recognition rate by taking commonly used letters and leaving out the barely used ones instead of recognizing all of the letters, and then using SVM and RDA character recognition methods. Our numerical results indicate that combining SVM and RDA performs better than other methods.

본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

Keywords

References

  1. 권재욱, 조성배, 김진형 (1992). 계층적 신경망을 이용한 다중 크기의 다중활자체 한글 문서인식. <한국정보과학회 논문지>, 19, 69-79.
  2. 김영화, 남지호 (2009). 영상 잡음의 분산 추정에 관한 통계적 알고리즘 및 응용. <한국데이터정보과학회지>, 20, 869-878.
  3. 박정민, 김경재, 한인구 (2005). 지지도벡터기계를 이용한 기업부도예측. <경영정보학연구>, 15, 51-63.
  4. 오광식, 김상민, 이동로 (1997). 문자인식을 위한 로버스트 역전파 알고리즘. <한국데이터정보과학회지>, 8, 163-171.
  5. 이성환 (1993). 다양한 활자체 및 크기를 갖는 대용량 한글의 고속 인식을 위한 최적 트리 분류기. <한국정보과학회 논문지>, 20, 1083-1092.
  6. 이진수, 권오준, 방승양 (1996). 개선된 자소 인식 방법을 이용한 인쇄체 한글 인식. <한국정보과학회 논문지>, 23, 841-851.
  7. 이판호, 장희돈, 남궁재찬 (1994). 동적 자소 분할과 신경망을 이용한 인쇄체 한글 문자 인식에 관한 연구. <한국통신학회 논문지>, 19, 2133-2146.
  8. 장승익, 남윤석 (2004). 낱자 특징 기반 자소 인식을 이용한 한글 인식방법. <한국정보처리학회 춘계학술발표대회논문집>, 11, 351-354.
  9. 조완현 (1999). 문자인식의 기본 원리와 여러 가지 인식방법의 성능비교. <한국자료분석학회 논문지>, 1, 1-14.
  10. Cho, M. and Park, E. (2008). Analyzing customer management data by data mining: Case study on Churn prediction models for Insurance company in Korea. Journal of the Korean Data & Information Science Society, 19, 1007-1018.
  11. Friedman, J. H. (1988). Regularized discriminant analysis. Journal of the American Statistical Association, 84, 165-175.
  12. Huang, Z., Chen, H., Hsu, J. and Chen, H. (2004). Credit rating analysis with support vector machine and neural network. Decision Support Systems, 37, 543-558. https://doi.org/10.1016/S0167-9236(03)00086-1
  13. Hwang, J. S., Lee, J. Y. and Kim, J. Y. (2006). A comparison study of multiclass SVM methods in microarray data. Journal of the Korean Data & Information Science Society, 17, 311-324.
  14. Joachims, T. (1998). Text categorization with support vector machines. Proceedings of the European Conference on Machine Learning (ECML), 10, 137-142.
  15. Johnson, R. A. and Wichern, D. W. (1992). Applied multivariate statistical analysis, 3rd Ed., Springer, New Jersey.
  16. Kim, K. and Lee, C. (2003). A study of data mining optimization model for credit evaluation. Journal of the Korean Data & Information Science Society, 14, 825-836.
  17. Kim, M. S. and Baek, J. S. (1999). Feature extraction and statistical pattern recognition for image data using wavelet decomposition. The Korean Communications in Statistics, 6, 831-841.
  18. Vapnik, V. N. (1995). The nature of statistical learning theory, Springer, New York.