DOI QR코드

DOI QR Code

Text Area Extraction Method for Color Images Based on Labeling and Gradient Difference Method

레이블링 기법과 밝기값 변화에 기반한 컬러영상의 문자영역 추출 방법

  • 원종길 (경원대학교 일반대학원 전자계산학과) ;
  • 김혜영 (경원대학교 일반대학원 전자계산학과) ;
  • 조진수 (경원대학교 IT대학 컴퓨터공학과)
  • Received : 2011.10.18
  • Accepted : 2011.11.14
  • Published : 2011.12.28

Abstract

As the use of image input and output devices increases, the importance of extracting text area in color images is also increasing. In this paper, in order to extract text area of the images efficiently, we present a text area extraction method for color images based on labeling and gradient difference method. The proposed method first eliminates non-text area using the processes of labeling and filtering. After generating the candidates of text area by using the property that is high gradient difference in text area, text area is extracted using the post-processing of noise removal and text area merging. The benefits of the proposed method are its simplicity and high accuracy that is better than the conventional methods. Experimental results show that precision, recall and inverse ratio of non-text extraction (IRNTE) of the proposed method are 99.59%, 98.65% and 82.30%, respectively.

영상 입출력 장치 사용이 증가함에 따라 컬러영상 내 문자영역 추출의 중요성 또한 높아지고 있다. 본 논문은 이러한 영상 내 문자영역을 효과적으로 추출하기 위해 레이블링 기법과 화소 단위의 밝기값 변화에 기반한 문자영역 추출 방법을 제안한다. 제안하는 방법은 레이블링 및 필터링 과정을 통해 비문자 영역을 미리 제거하고, 밝기값의 변화가 큰 문자영역의 특성을 이용하여 문자영역 후보군을 추출한 후 노이즈 제거 및 문자영역 병합의 후처리 과정을 통해 문자영역을 추출한다. 제안한 방법의 강점은 기존 방법보다 단순하면서도 높은 정확성에 있다. 실험 결과 제안한 방법의 정확도와 재현율, 비문자 추출의 역 비율(IRNTE)은 각각 99.59%, 98.65%, 82.30%로 측정되었다.

Keywords

References

  1. E. K. Wong and Minya Chen, "A new robust algorithm for video text extraction," Pattern Recognition, Vol.36, No.6, pp.1397-1406, 2003. https://doi.org/10.1016/S0031-3203(02)00230-3
  2. 권재현, 손창환, 박태용, 조양호, 하영호, "문자 영역을 강조하기 위한 적응적 오차 확산법", 대한전자공학회 논문지, 제43권, 제1호, pp.9-17, 2006.
  3. Palaiahnakote Shivakumara, Trung Quy Phan, and Chew Lim Tan, "A Gradient Difference Based Technique for Video Text Detection," Proceedings of International Conference on Document Analysis and Recognition, pp.156-160, 2009.
  4. 장대근, 황찬식, "이미지 필터와 제한조건을 이용한 문서영상 구조분석", 정보처리학회 논문지B, 제9권, 제3호, pp.311-318, 2002. https://doi.org/10.3745/KIPSTB.2002.9B.3.311
  5. 장대근, 황찬식, "연결요소 방법과 메디안 필터를 이용한 문서영상 기하학적 구조분석", 한국통신 학회 논문지, 제27권, 제8호, pp.805-813, 2002.
  6. C. Strouthopoulos, N. Papamarkos, and A. E. Atsalakis, "Text extraction in complex color document," Pattern Recognition, Vol.35, No.8, pp.1743-1758, 2002. https://doi.org/10.1016/S0031-3203(01)00167-4
  7. B. T. Chun, Y. L. Bae, and T. Y. Kim, "Text extraction in videos using topographical feature of characters," IEEE International Conference on Fuzzy System, Vol.2, pp.1126-1130, 2002.
  8. 전병태, 송치양, "주파수 특성과 역전파 신경망 알고리즘을 이용한 문자 영역 분할 방법", 한국컴퓨터정보학회 논문지, 제11권, 제4호, pp.55-60, 2006.
  9. 이형렬, "복잡한 컬러 문서에서의 문자추출 및 문자인식", 김천과학대학 논문집, 제27권, pp.111-115, 2001.
  10. Sachin Grover, Kushal Arora, and Suman K. Mitra, "Text Extraction from Document Images using Edge Information," IEEE India Council Conference, pp.1-4, 2010.
  11. Q. Yuan and C. L. Tan, "Text Extraction from Gray Scale Document Images using Edge Information," Proceedings of International Conference on Document Analysis and Recognition, pp.302-306, 2002.
  12. 박종천, 황동국, 이우람, 전병민, "적응적 문자-에지 맵을 이용한 다양한 기울기와 크기를 갖는 텍스트 영역 검출", 한국콘텐츠학회 종합학술대회 논문집, 제5권, 제1호, pp.5-9, 2007.
  13. Y. J. Song, "Text Region Extraction and Text Segmentation on Camera-captured Document Style Images," Proceedings of International Conference on Document Analysis and Recognition, Vol.1, pp.172-176, 2005.
  14. 김지수, 김수형, "자연영상 텍스트 이진화를 위한 3단계 색상 군집화 알고리즘", 정보처리학회논문지B, 제12권, 제7호, pp.1-8, 2005.
  15. 김의정, "칼라 문서에서 문자 영역 추출 및 문자 분리", 한국 퍼지 및 지능시스템학회 논문지, 제9권, 제4호, pp.444-450, 1999.
  16. K. C. Jung and J. H. Han, "Hybrid approach to efficient text extraction in complex color images," Pattern Recognition, Vol.25, No.6, pp.679-699, 2004. https://doi.org/10.1016/j.patrec.2004.01.017
  17. 정기철, "복잡한 영상 내의 문자영역 추출을 위한 텍스춰와 연결성분 방법의 결합", 대한전자공학회 논문지, 제41권, 제6호, pp.175-186, 2004.
  18. G. Bradski and A.. Kaehler, Learning OpenCV - Computer Vicion with the OpenCV Library, O'Reilly Media, 2008
  19. Sameer Antani, Ullas Gargi, David Crandall, Tarak Gandhi, and Rangachar Kasturi, "Extraction of Text in Video," Technical Report, CSE-99-016, 1999.
  20. A. Wernicke and R. Lienhart, "On the segmentation of text in videos," IEEE International Conference on Multimedia and Expo, Vol.3, pp.1511-1514, 2000 https://doi.org/10.1109/ICME.2000.871054
  21. Nobuyuki Otsu, "A Tlreshold Selection Method from Gray-Level Histograms," IEEE Transactions on Systems, Man and Cybernetics, Vol.9, No.1, pp.62-66, 1979. https://doi.org/10.1109/TSMC.1979.4310076

Cited by

  1. Efficient Signal Filling Method Using Watershed Algorithm for MRC-based Image Compression vol.15, pp.2, 2015, https://doi.org/10.5392/JKCA.2015.15.02.021