DOI QR코드

DOI QR Code

골격을 이용한 문자 인식을 위한 지역경계 연산

Regional Boundary Operation for Character Recognition Using Skeleton

  • 유석원 (서경대학교 컴퓨터과학과)
  • Yoo, Suk Won (Dept. of Computer Science, SeoKyeong University)
  • 투고 : 2018.08.11
  • 심사 : 2018.09.28
  • 발행 : 2018.11.30

초록

학습 데이터를 구성하는 각각의 문자들에 대해 서로 다른 글자체들을 픽셀 단위로 더해서 MASK를 만들고, 해당 MASK에 속하는 픽셀값들을 세 영역으로 나눈다. 실험 데이터를 골격 형태로 수정하고, 지역 경계 연산을 사용하여 수정된 실험 데이터의 배경 중에서 문자의 골격에 인접한 배경 영역을 구분하는 경계를 만든다. 수정된 실험 데이터와 MASK들 간의 불일치 정도를 계산해서 최소값을 가지는 MASK를 찾는다. 이 MASK가 해당 실험 데이터에 대해 최종적으로 인식된 학습 데이터 문자로 선택된다. 문자의 골격과 지역 경계 연산을 사용하는 인식법은 주어진 학습 데이터에 새로운 글자체를 추가해서 학습 데이터를 쉽게 확장할 수 있으며, 구현하기가 간단하면서도 높은 문자 인식률을 얻을 수 있다.

For each character constituting learning data, different fonts are added in pixel unit to create MASK, and then pixel values belonging to the MASK are divided into three groups. The experimental data are modified into skeletal forms, and then regional boundary operation is used to create a boundary that distinguishes the background region adjacent to the skeleton of the character from the background of the modified experimental data. Discordance values between the modified experimental data and the MASKs are calculated, and then the MASK with the minimum value is found. This MASK is selected as a finally recognized result for the given experiment data. The recognition algorithm using skeleton of the character and the regional boundary operation can easily extend the learning data set by adding new fonts to the given learning data, and also it is simple to implement, and high character recognition rate can be obtained.

키워드

GJMGCK_2018_v4n4_361_f0001.png 이미지

그림 1. 10개의 자동차 번호판 숫자들 Figure 1. 10 Number of Plate Numbers

GJMGCK_2018_v4n4_361_f0002.png 이미지

그림 2. 10개의 자동차 번호판 숫자들의 골격들 Figure 2. 10 Number of Skeletons of Plate Numbers

GJMGCK_2018_v4n4_361_f0003.png 이미지

그림 3. 10개의 자동차 번호판 숫자들의 골격들의 축소형 Figure 3. Shrunk Versions of Skeletons of 10 Plate Numbers

표 1. 자동차 번호판들과 학습 데이터의 MASK들과의 연산 결과 Table 1. Calculation Results between MASKs of Learning Data and Plate Numbers

GJMGCK_2018_v4n4_361_t0001.png 이미지

참고문헌

  1. E. Hall, Computer Image Processing and Recognition, Academic Press, pp.76-153, 1979.
  2. G. Dougherty, Pattern Recognition and Classification, Springer, pp. 123-134, 2012.
  3. D. Eberly, "Skeletonization of 2D Binary Images", www.geometrictools.com, pp.1-11, 2008.
  4. K. Jang, S. Lee, "Analysis of Digital Video with a Focus on the Documentary Colored Hearing", Journal of Convergence on Culture Technology(JCCT), Vol.2, No.2, pp.23-27, 2016. https://doi.org/10.17703/JCCT.2016.2.2.23
  5. W. Pratt, Introduction to Digital Image Processing, CRC Press, pp. 139-154, 2013.
  6. J. Parker, Algorithms for Image Processing and Computer Vision, Wiley, pp.137-175, 2010.
  7. C. Suen, P.Wang, Thinning Methodologies for Pattern Recognition, World Scientific Press, pp.113-136, 1994.
  8. S. Yoo, "Character Recognition Algorithm using Accumulation Mask", International Journal of Advanced Culture Technology(IJACT), Vol.6, No.2, pp.123-128, 2018. https://doi.org/10.17703/IJACT.2018.6.2.123