DOI QR코드

DOI QR Code

A method of searching the optimum performance of a classifier by testing only the significant events

중요한 이벤트만을 검색함으로써 분류기의 최적 성능을 찾는 방법

  • Kim, Dong-Hui (Department of Computer Science and Engineering, Chungnam National University) ;
  • Lee, Won Don (Department of Computer Science and Engineering, Chungnam National University)
  • Received : 2014.03.31
  • Accepted : 2014.05.26
  • Published : 2014.06.30

Abstract

Too much information exists in ubiquitous environment, and therefore it is not easy to obtain the appropriately classified information from the available data set. Decision tree algorithm is useful in the field of data mining or machine learning system, as it is fast and deduces good result on the problem of classification. Sometimes, however, a decision tree may have leaf nodes which consist of only a few or noise data. The decisions made by those weak leaves will not be effective and therefore should be excluded in the decision process. This paper proposes a method using a classifier, UChoo, for solving a classification problem, and suggests an effective method of decision process involving only the important leaves and thereby excluding the noisy leaves. The experiment shows that this method is effective and reduces the erroneous decisions and can be applied when only important decisions should be made.

유비쿼터스 환경에서는 수많은 정보들이 존재한다. 하지만 이 정보들은 너무 광범위하기 때문에 이로부터 필요에 따라 적절하게 사용 할 수 있는 정보를 얻기란 쉽지가 않다. 이로 인해 의사 결정 트리 알고리즘은 데이터 마이닝 분야 또는 기계 학습 시스템 분야에서 매우 유용하게 사용된다. 왜냐하면 빠르고 정확하게 정보를 분류하여 좋은 결과를 도출하기 때문이다. 하지만 때때로 의사 결정 트리가 매우 작은 데이터나 노이즈 데이터로 구성된 리프 노드들로 인해 좋은 정보를 제공하지 못하는 경우가 있다. 이 논문은 이러한 분류 문제를 해결하기 위해 분류기, UChoo를 사용할 것이고 노이즈 또는 노이즈 형태로 보이는 리프들을 제외하고 오직 중요한 리프들만을 검사하는 효과적인 방법을 제안한다. 그리고 실험을 통하여 의사 결정시 오직 중요한 리프들만을 의사 결정 트리에서 선택함으로써 효과적으로 에러가 줄어드는 것을 보일 것이다.

Keywords

References

  1. J. R. Quinlan, "C4.5:Program for Machine Learning," San Mateo, Calif, Morgan Kaufmann, 1993
  2. T. S. Lim, W. Y. Loh, and Y. S. Shih, "A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-Tree Old and New Classification Algorithms," Machine Learning, vol. 40, no. 3, pp. 203-228, Sept.2000 https://doi.org/10.1023/A:1007608224229
  3. Paul E. Utgoff, "Incremental Induction of Decision Trees", Machine Learning, vol. 4, no. 2, pp. 161-186, 1989 https://doi.org/10.1023/A:1022699900025
  4. Dong-Hui Kim, Won Don Lee, "The performance of a classifier by testing only the significant events", 2014 International Conference on Information Science and Applications. technically Co-Sponsored by IEEE, pp.372-375, May. 2014
  5. Dong-Hui, Dong-Hyeok Lee and Won Don Lee, "Classifier using Extended Data Expression", IEEE Mountain Workshop on Adaptive and LerningSystems, pp.154-159, July.2006
  6. Dong-Hui Kim, Dong-Hun Seo, Yingrong Li, Won Don Lee, "A Classifier Capable of Rule Refinement", 2008 IEEE International Conference on Service Operations and Logistics, and Informatics, pp.168-173, Oct.2008
  7. K. Bache,M. Luchiman, UCI Machine Learning Repository [http://archive.ics.uci.edu/ml/]