DOI QR코드

DOI QR Code

Multiple SVM Classifier for Pattern Classification in Data Mining

데이터 마이닝에서 패턴 분류를 위한 다중 SVM 분류기

  • 김만선 (공주대학교 컴퓨터공학과) ;
  • 이상용 (공주대학교 정보통신공학부)
  • Published : 2005.06.01

Abstract

Pattern classification extracts various types of pattern information expressing objects in the real world and decides their class. The top priority of pattern classification technologies is to improve the performance of classification and, for this, many researches have tried various approaches for the last 40 years. Classification methods used in pattern classification include base classifier based on the probabilistic inference of patterns, decision tree, method based on distance function, neural network and clustering but they are not efficient in analyzing a large amount of multi-dimensional data. Thus, there are active researches on multiple classifier systems, which improve the performance of classification by combining problems using a number of mutually compensatory classifiers. The present study identifies problems in previous researches on multiple SVM classifiers, and proposes BORSE, a model that, based on 1:M policy in order to expand SVM to a multiple class classifier, regards each SVM output as a signal with non-linear pattern, trains the neural network for the pattern and combine the final results of classification performance.

패턴 분류는 실세계의 객체를 표현한 다양한 형태의 패턴 정보를 추출하여, 이것이 어떤 부류(클래스)인가를 결정하는 것이다. 패턴 분류 기술은 데이터 마이닝, 산업 자동화나 업무자동화를 위한 컴퓨터 응용 소프트웨어 기술로서 현재 다양한 분야에서 활용되고 있다. 패턴 분류 기술의 최대 목표는 분류 성능 향상이며 이것을 위해 지난 40년간 많은 연구자들이 다양한 접근 방법들을 시도해 왔다. 주로 이용되는 단일 분류 방법들로는 패턴들의 확률적 추론에 기반한 베이즈 분류기, 결정 트리, 거리함수를 이용하는 방법, 신경망, 군집화 등이 있으나 대용량 다차원 데이터를 분석하기에는 효율적이지 못하다. 따라서 상호 보완적인 여러 분류기들을 사용해 결합을 통하여 성능 향상에 도움을 주고 있는 다중 분류기 시스템에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 다중 SVM(Support Vector Machine) 분류기에 관한 기존 연구의 문제점을 지적하고 새로운 모델을 제안한다. SVM을 다중 클래스 분류기로 확장하기 위해 일대다 정책을 기반으로 하여 각각의 SVM 출력값을 비선형 패턴을 갖는 신호로 간주하고 이를 신경망에 학습하여 최종 분류 성능 결과를 결합하는 모델인 BORSE(Bootstrap Resampling SVM by Ensemble)를 제안한다.

Keywords

References

  1. C. Park, S. Kim, "Searching for Optimal Ensemble of Feature-classifier Pairs in Gene Expression Profile using Genetic Algorithm", Journal of KISS, Vol.31, No.4 , pp. 525-536, 2004.
  2. S. Gutta, H. Wechsler, "Face Recognition Using Hybrid Classifier Systems", Proc. of International Conference on Neural Networks. pp. 1017-1022, 1996.
  3. H. Song, "A Multiple Classifier System based on Dynamic Classifier Selection having Local Property", Journal of KISS, Vol.30, No.3 , pp. 339-346, 2003.
  4. P. Clarkson, P. Moreno, "On the use of support vector machines for phonetic classification", Proc. of International Conference on Acoustics, Speech, Signal Processing, pp. 858-588, 1999.
  5. S. Zahorian, P. Silsbee, and X. Wang. "Phone Classification with Segmental Features and a Binary-Pair Partitioned Neural Network Classifier", IEEE Conference on Acoustics, Speech, and Signal Processing, 1997.
  6. M. N. Nguyen and J. C. Rajapakse, "Multi-Class Support Vector Machines for Protein", Genome Informatics, Vol. 14, pp. 218-227, 2003.
  7. K. Lee, et al, "Unconstrained Handwritten Numeral Recognition using Multistage Combination of Multiple Recognizers", Journal of KISS, Vol. 26, No. 1, pp. 93-105, 1999.
  8. E. A. Patric and F. P. Fisher, "A Generalized k-Nearest Neighbor Rule", Information and control. Vol. 16, No. 2, pp. 128-152, 1970. https://doi.org/10.1016/S0019-9958(70)90081-1
  9. http://www.ics.uci.edu/~mlearn/MLRepository.html.

Cited by

  1. Electroencephalogram-based Driver Drowsiness Detection System Using AR Coefficients and SVM vol.22, pp.6, 2012, https://doi.org/10.5391/JKIIS.2012.22.6.768