DOI QR코드

DOI QR Code

Document Image Binarization Technique using MSER

MSER을 이용한 문서 이미지 이진화 기법

  • Yu, Young-Jung (Department of Computer Engineering, Pusan University of Foreign Studies)
  • Received : 2014.04.24
  • Accepted : 2014.06.16
  • Published : 2014.08.31

Abstract

Document image binarization is largely used as previous stage of document recognition. And the result of document recognition is much affected from the result of document image binarization. There were many studies to binarize document images. The results of previous studies for document image binarization is varied according to the state of document images. In this paper, we propose a technique for document image binarization using MSER that is applied to extract objects from an image. At first, raw MSER objects are extracted from a document image. Because the raw MSER objects cannot be used for document image binarization, the extracted raw MSER objects are modified. Then the final MSER objects are used for document image binarization with the contrast image that is extracted from the document image. Experimental results show that the proposed technique is useful for document image binarization.

문서 이미지의 이진화는 문서 인식의 이전 단계에서 주로 사용되며, 이진화의 성공 여부에 따라 문서 인식의 결과에 영향을 미치는 중요한 단계로 볼 수 있다. 지금까지 문서 이미지를 이진화 하기 위한 다양한 기법들이 연구되었지만, 문서 이미지의 상태에 따라 그 결과는 다양하다. 본 논문에서는 객체 추출에 많이 이용되는 MSER(Maximally Stable Extremal Region)을 이용하여 문서 이미지를 이진화하는 기법을 제안한다. 먼저 문서 이미지에서 MSER 객체를 추출한다. 추출된 MSER 객체는 그 자체로 문서 이미지 이진화에 사용되기는 어렵기 때문에 사용하기 적합한 형태로 변경되는 과정을 거친다. 그리고 최종 MSER 객체와 문서 이미지로부터 추출한 대비 이진 이미지를 이용하여 최종 이진 이미지를 계산한다. 실험결과는 본 논문에서 제안한 방법이 문서 이미지의 이진화에 유용함을 보여준다.

Keywords

References

  1. N. Otsu, "A Threshold Selection Method from Gray Level Histogram," IEEE Transactions on System, Man, Cybernetics, vol. 19, no. 1, pp. 62-66, Jan. 1978.
  2. W. Niblack, "An Introduction to Digital Image Processing," Englewood Cliffs, NJ:Prentice-Hall, 1986.
  3. J. Sauvola and M. Pietikainen, "Adaptive Document Image Binarization," Pattern Recognition, vol. 33, no. 2, pp. 225-236, Jan. 2000. https://doi.org/10.1016/S0031-3203(99)00055-2
  4. B. Gatos, I. Pratikakis, and S. Perantonis, "Adaptive Degraded Document Image Binarization," Pattern Recognition, vol. 39, no. 3, pp. 317-327, Mar. 2006. https://doi.org/10.1016/j.patcog.2005.09.010
  5. S. Lu, B. Su, and C. L. Tan, "Document Image Binarization using Background Estimation and Stroke Edges," International Journal on Document Analysis and Recognition, vol. 13, no. 4, pp. 303-314, Dec. 2010. https://doi.org/10.1007/s10032-010-0130-8
  6. B. Su, S. Lu, and C. L. Tan, "Binarization of Historical Handwritten Document Images using Local Maximum and Minimum Filter," in Proceeding of the International Workshop on Document Analysis Systems, pp. 159-166, Jun. 2010.
  7. B. Su, S. Lu, and C. L. Tan, "Robust Document Image Binarization Technique for Degraded Document Images," IEEE Transactions on Image Processing, vol. 22, no. 4, pp. 1408-1417, Apr. 2013. https://doi.org/10.1109/TIP.2012.2231089
  8. J. Matas, O. Chum, M.Urban, and T. Pajdla, "Robust Wide Baseline Stereo from Maximally Stable Extremal Regions," In Proceeding of the British Machine Vision Conference, pp. 384-393, 2002.

Cited by

  1. Noise Robust Document Image Binarization using Text Region Detection and Down Sampli vol.18, pp.7, 2015, https://doi.org/10.9717/kmms.2015.18.7.843
  2. MSER-b 이진화 기법을 이용한 스마트폰 문서 이미지 보정 기법 vol.19, pp.1, 2014, https://doi.org/10.6109/jkiice.2015.19.1.201
  3. 자연영상에서 문자의 형태 분석을 이용한 문자영역 추출에 관한 연구 vol.9, pp.11, 2014, https://doi.org/10.15207/jkcs.2018.9.11.061