Spatial Gap Estimation for Word Separation in Handwritten Legal Amounts on BAnk Check

필기체 수표 금액 문장에서의 단어 분리를 위한 공간적 간격 추정

  • Published : 2005.08.01

Abstract

An efficient method of estimating the spatial gaps between the connected components has been prposed to separatethe individual words from a handwritten legal amount on bank check. Owing to the inherent problem of underestimation or overestimation, the previous gap measures have much difficulty in being applied to the legal amounts that usually include the great shape variability by writer's unconstrained writing style and touching or irregular gaps between words by space limitation. In order to alleviate such burden and improve word separation performance, we have developed a modified version of each distance measure. Through a series of word separation experiments, we found that the modified distance measures show a better performance with over $2-3\%$ of the word separation rate than their corresponding original distance measures.

본 논문에서는 수표 영상 내의 필기체 문장 금액을 개별 단어로 분리하기 위해 연결 성분 간의 공간적 간격을 효과적으로 측정하는 방법을 제안하였다. 기존의 간격 측정 방법들은 과대추정 또는 과소추정과 같은 문제를 내포하고 있어 무제약적 필기 스타일에 의한 문자의 왜곡과 필기 공간의 제약으로 인한 연결 성분 간 중첩 및 접촉, 그리고 단어 간 또는 문자 간 간격의 불규칙성이 심하게 나타나는 문장 금액에 적용하는데 많은 어려움을 가진다. 본 논문에서는 기존의 측정 방식들을 수정 보완하여 측정 과정에서의 오류를 줄임으로써 단어 분리 성능을 향상시키고자 하였다. 단어 분리 실험 결과로부터 수정된 각 거리 측정법이 대응되는 기존의 측정법에 비해 $2-3\%$ 정도 향상된 단어 분리 성능을 보임을 확인하였다.

Keywords

References

  1. 임길택, 진성일, 'Karhunen-Loeve 변환 기반의 부분 공간 인식기와 결합된 다중 노벨티 인식기를 이용한 필기체 숫자 인식, '전자공학회 논문지, 제35권 C편 제6호, pp. 88-98, 6월 1998
  2. A. Ei-Yacoubi, M. Gilloux, R. Sabourin, and C.Y. Suen, 'An Hmm-Based Approach for Off-Line Unconstrained Handwritten Word Modeling and Recognition,' IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 21, no. 8, pp. 752-760, Aug. 1999 https://doi.org/10.1109/34.784288
  3. D. Guillevic and C.Y. Suen, 'Recognition of Legal Amounts on Bank Cheques,' Pattern Analysis and Applications, vol. 1, no. 1, pp. 28-41, 1998 https://doi.org/10.1007/BF01238024
  4. G. Seni and E. Cohen, 'External Word Segmentation of Off-line Handwritten Text Lines,' Pattern Recognition, vol. 27, no. 1, pp. 41-52, 1994 https://doi.org/10.1016/0031-3203(94)90016-7
  5. U. Mahadevan and R.C. Nagabushnam, 'Gap Metrics for Word Separation in Hand written Lines,' Proc. ICDAR, vol. 1, pp. 124-127, 1995
  6. J. Schurmann, 'Document Analysis - from Pixels to Contents,' Proc. IEEE, vol. 80, no. 7, pp. 1101-1119, July 1992
  7. J. Zhou, C.Y. Suen, and K. Liu, 'A Feed back-based Approach for Segmenting Hand written Legal Amounts on Bank Cheques,' Proc. ICDAR, pp. 887-891, 2001
  8. Y. Linde, A. Buzo, and R.M. Gray, 'An algorithm for vector quantizer design,' IEEE Trans. Communications, vol. 28, no. 1, pp. 84-95, Jan. 1980 https://doi.org/10.1109/TCOM.1980.1094577
  9. K.K. Kim, J.H. Kim, Y.K. Chung, and C.Y. Suen, 'Legal Amount Recognition Based on the Segmentation Hypotheses for Bank Check Processing,' Proc. ICDAR, pp. 964-967, 2001