신경망을 이용한 필기 숫자 인식에서 부류 분별에 기반한 특징 선택

Feature Selection Based on Class Separation in Handwritten Numeral Recognition Using Neural Network

  • 이진선 (우석대학교 정보통신 및 컴퓨터공학부)
  • 발행 : 1999.02.01

초록

본 논문의 목적은 필기 숫자 인식에서 특징의 부류 분별력을 분석하고, 이를 특징 선택에 활용하는 것이다. 부류 분별력을 측정하기 위하여 Parzen 윈도우를 이용하여 부류 분포를 추정하였고, 서로 다른 부류의 부류 분포간의 거리를 부류 분별로 정의하였다. 이렇게 계산된 부류 분별을 이용하여, 특징 벡터에서 쓸모 없거나 중복성을 갖는 특징을 제거하여 특징 벡터의 차원을 줄인다. 실험은 CENPARMI 필기 숫자에 대해 수행하였으며 10개 부류 전체 뿐 아니라 2개 부류에 대해서도 수행하였다. 실험 결과 10-부류 필기 숫자 인식에서 256-차원 원래 특징 벡터를 인식률 손실 없이 22% 줄일 수 있어, 부류 분별이 특징 선택을 위한 유용한 도구임을 보였다.

The primary purposes in this paper are to analyze the class separation of features in handwritten numeral recognition and to make use of the results in feature selection. Using the Parzen window technique, we compute the class distributions and define the class separation to be the overlapping distance of two class distributions. The dimension of a feature vector is reduced by removing the void or redundant feature cells based on the class separation information. The experiments have been performed on the CENPARMI handwritten numeral database, and partial classification and full classification have been tested. The results show that the class separation is very effective for the feature selection in the 10-class handwritten numeral recognition problem since we could reduce the dimension of the original 256-dimensional feature vector by 22%.

키워드