An N-version Learning Approach to Enhance the Prediction Accuracy of Classification Systems in Genetics-based Learning Environments

유전학 기반 학습 환경하에서 분류 시스템의 성능 향상을 위한 엔-버전 학습법

  • 김영준 (상명대학교 정보통신학부) ;
  • 홍철의 (상명대학교 정보통신학부)
  • Published : 1999.07.01

Abstract

DELVAUX is a genetics-based inductive learning system that learns a rule-set, which consists of Bayesian classification rules, from sets of examples for classification tasks. One problem that DELVAUX faces in the rule-set learning process is that, occasionally, the learning process ends with a local optimum without finding the best rule-set. Another problem is that, occasionally, the learning process ends with a rule-set that performs well for the training examples but not for the unknown testing examples. This paper describes efforts to alleviate these two problems centering on the N-version learning approach, in which multiple rule-sets are learning and a classification system is constructed with those learned rule-sets to improve the overall performance of a classification system. For the implementation of the N-version learning approach, we propose a decision-making scheme that can draw a decision using multiple rule-sets and a genetic algorithm approach to find a good combination of rule-sets from a set of learned rule-sets. We also present empirical results that evaluate the effect of the N-version learning approach in the DELVAUX learning environment.

델보는 주어진 사례의 집합으로부터 이들 사례들을 분류할 수 있는 베이지안 분류 규칙들로 이루어진 규칙 집합을 습득하는 유전학 기반 귀납적 학습 시스템이다. 규칙 집합의 습득과정에서 델보가 당면하게 되는 한 가지 문제점은 학습 과정이 최적의 규칙 집합이 아닌 지역 최적치를 습득하고 종료하는 경우가 가끔 발생한다는 것이다. 다른 하나의 문제점은 훈련 사례에 대한 경우와는 달리 새로운 평가 사례에 대해 분류 성능이 현저히 저하되는 규칙 집합을 습득하는 경우가 가끔 발생한다는 것이다. 본 논문에서는 이러한 문제점을 해결하여 보다 성능이 향상된 분류 시스템을 구축하기 위한 기법으로 엔-버전 시스템을 구축함으로써 분류 시스템의 전체적인 성능을 향상시키는 기법이다. 엔-버전 학습법의 구현을 위해 다수의 규칙 집합을 이용하여 최종 분류 결과를 도출해 내기 위한 기법과 습득된 규칙 합들로부터 분류 시스템을 구축하기 위한 최적의 규칙 집합의 조합을 찾기 위한 기법을 제시하고 다수의 사례 집합을 이용하여 엔-버전 학습법이 델보의 학습 환경에 미치는 영향을 평가하였다.

Keywords