Improving Classification Accuracy for Numerical and Nominal Data using Virtual Examples

가상예제를 이용한 수치 및 범주 속성 데이터의 분류 성능 향상

  • Lee, Yu-Jung (Department of Computer Engineering, Pusan National University) ;
  • Kang, Jae-Ho (Department of Computer Engineering, Pusan National University) ;
  • Kang, Byoung-Ho (Department of Computer Engineering, Pusan National University) ;
  • Ryu, Kwang-Ryel (Department of Computer Engineering, Pusan National University)
  • 이유정 (부산대학교 컴퓨터 공학과) ;
  • 강재호 (부산대학교 컴퓨터 공학과) ;
  • 강병호 (부산대학교 컴퓨터 공학과) ;
  • 류광렬 (부산대학교 컴퓨터 공학과)
  • Published : 2006.10.20

Abstract

본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주속성 및 수치속성 데이터에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이터를 대상으로 한 반면 본 연구에서는 범주속성 데이터에 대해서도 가상예제를 적용하여 효과를 확인하였다. 그리고 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 한 기존 연구들과는 달리 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이터와 수치 속성을 포함한 데이터를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

Keywords