DOI QR코드

DOI QR Code

에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출

Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization

  • 박종천 (충북대학교 컴퓨터공학과) ;
  • 이근왕 (청운대학교 멀티미디어학과)
  • Park, Jong-Cheon (Division of Computer Engineering, Chungbuk National University) ;
  • Lee, Keun-Wang (Dept. of the Multimedia Science, Chungwoon University)
  • 투고 : 2010.02.19
  • 심사 : 2010.03.18
  • 발행 : 2010.03.31

초록

자연 영상 내에 포함된 텍스트는 영상의 다양하고 중요한 특징을 갖는다. 그러므로 텍스트를 검출하고 추출하여 인식하는 것이 중요한 연구대상으로 연구되고 있다. 최근 모바일 폰 카메라를 기반으로 다양한 분야에서 많은 응용 기술이 연구 개발되고 있다. 본 논문은 에지 및 연결요소를 이용한 장면 텍스트 검출 방법을 제안한다. 그레이스케일 영상으로부터 에지 성분 검출과 지역적 표준편차를 이용하여 텍스트 영역의 경계선을 검출하고, RGB 컬러공간의 유클리디안 거리를 기준으로 연결요소를 검출한다. 검출된 에지 및 연결요소를 레이블링하고 각각 영역의 외곽사각형을 구한다. 텍스트의 휴리스틱 이용하여 후보 텍스트를 추출한다. 후보 텍스트 영역을 병합하여 하나의 후보 텍스트 영역을 생성하고, 후보 텍스트의 지역적 인접성과 구조적 유사성으로 후보 텍스트를 검증함으로서 최종적인 텍스트 영역을 검출하였다. 실험결과 에지 및 컬러 연결요소 특징을 상호 보완함으로서 텍스트 영역의 검출률을 향상시켰다.

Text in natural images has a various and important feature of image. Therefore, to detect text and extraction of text, recognizing it is a studied as an important research area. Lately, many applications of various fields is being developed based on mobile phone camera technology. Detecting edge component form gray-scale image and detect an boundary of text regions by local standard deviation and get an connected components using Euclidean distance of RGB color space. Labeling the detected edges and connected component and get bounding boxes each regions. Candidate of text achieved with heuristic rule of text. Detected candidate text regions was merged for generation for one candidate text region, then text region detected with verifying candidate text region using ectilarity characterization of adjacency and ectilarity between candidate text regions. Experctental results, We improved text region detection rate using completentary of edge and color connected component.

키워드

참고문헌

  1. N. Ezaki, M. Bulacu, L. Schomaker, "Text detection from natural scene images: towards a system for visually impaired persons", Pattern Recognition, ICPR 2004, Proceedings of the 17th International Conference on Volume 2, pp.683-686, 2004.
  2. Toan Nguyen Dinh, Jonghyun Park, GueeSang Lee, "Low-Complexity Text Extraction in Korean Signboard for Mobile Applications", CIT(Computer and Information Technology), 2008. 8th IEEE International Conference on pp.333-337, 2008
  3. Minhua Li, Chunheng Wang, "An Adaptive Text Detection Approach in Images and Video Frames", Neural Networks, IJCNN 2008, pp.72-77, 2008.
  4. Smith, M. A. and T. Kanade, "Video Skimming for Quick Browsing Based on Audio and Image Characterization", Carnegie Mellon University, Technical Report CMU-CS-95-186, 1995.
  5. Anil K. Jain, Bin Yu, "Automatic Text Location in Images and Video Frames", Pattern Recognition, Vol.31, No. 12, pp. 2055-2076, 1998. https://doi.org/10.1016/S0031-3203(98)00067-3
  6. Wolf, C., J.M. Jolion and F. Chassaing, "Text Localization, Enhancement and Binarization in Multimedia Documents," In Proceedings of the International Conference on Pattern Recognition, Vol.4, pp. 1037-1040, 2002.
  7. J. Canny, "A Computational Approach to Edge Detection", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, No. 6, pp.679-698, 1986. https://doi.org/10.1109/TPAMI.1986.4767851
  8. Haralick, Robert M., and Linda G. Shapiro, "Computer and Robot Vision", Vol 1, Addison - Wesley, pp.28-48, 1992.
  9. Junker, M. and R. Hoch, "On the Evaluation of Document analysis components by recall, precision, and accuracy", Proceedings of ICDAR, pp.713-716, 1999.