DOI QR코드

DOI QR Code

하이브리드 다중모델 학습기법을 이용한 자동 문서 분류

Automatic Text Categorization Using Hybrid Multiple Model Schemes

  • 명순희 (용인송담대학 인터넷경영정보과) ;
  • 김인철 (경기대학교 전자계산학과)
  • 발행 : 2002.12.01

초록

본 논문에서는 다중 모델 기계학습 기법을 이용하여 자동 문서 분류의 성능과 신뢰도를 향상시킬 수 있는 연구와 실험 결과를 기술하였다. 기존의 다중 모델 기계 학습법들이 훈련 데이터 또는 학습 알고리즘의 편향에 의한 오류를 극복하고자 한 것인데 비해 본 논문에서 제안한 메타 학습을 이용한 하이브리드 다중 모델 방식은 이 두 가지의 오류 원인을 동시에 해소하고자 하였다. 다양한 문서 집합에 대한 실험 결과. 본 논문에서 제안한 하이브리드 다중 모델 학습법이 전반적으로 기존의 일반 다중모델 학습법들에 비해 높은 성능을 보였으며, 다중 모델의 결합 방식으로서 메타 학습이 투표 방식에 비해 효율적인 것으로 나타났다.

Inductive learning and classification techniques have been employed in various research and applications that organize textual data to solve the problem of information access. In this study, we develop hybrid model combination methods which incorporate the concepts and techniques for multiple modeling algorithms to improve the accuracy of text classification, and conduct experiments to evaluate the performances of proposed schemes. Boosted stacking, one of the extended stacking schemes proposed in this study yields higher accuracy relative to the conventional model combination methods and single classifiers.

키워드

참고문헌

  1. Machine Learning v.36 An Empirical comparison of voting classification algorithms: bagging, boosting,and variants Bauer;Eric;Kohavi;Ron https://doi.org/10.1023/A:1007515423169
  2. Machine Learning v.24 Bagging predictors Breiman,Leo
  3. JASIS v.46 Machine learning for infomation retrieval: neural networks, symbolic learning and genetic algorithms Chen,H. https://doi.org/10.1002/(SICI)1097-4571(199504)46:3<194::AID-ASI4>3.0.CO;2-S
  4. Machine Learning v.29 On the optimality of the simple Bayesian classifier under zero one loss Domingos,P.;Pazzani,M. https://doi.org/10.1023/A:1007413511361
  5. Data Mining: Concepts and Techniques Han,Jiawei;Micheline Kamber
  6. IBM Research Report RC-21570 Advances in Predictive Model Generation for Data Mining Hong,Se June;Weiss,Sholom M.
  7. Proceedings of SDAIR-94, 3rd Annual Symposium on Document Analysis and Information Retrieval A comparison of two learning alforithms in text categorization Lewis,D.D.;Ringuette,M.
  8. Machine Learning Mitchell,Tom
  9. Text Mining workshop on the 10th European Conference on Machine Learning ECML98 Efficient text cateforization Mladeni'c,D.;Grobelnik,M.
  10. Introduction to information Rerieval Salton,Gerard
  11. Computational Learning Theory: 4th European Conference, EuroCOLT'99 Theoretical views of boosting Schaphire,Robert E.
  12. SIGKDD'00 Workshop on Text Mining A Feature weight adjustment algorithm for document categoriztion Shankar;Shrikanth;Karypis;George
  13. Data Mining: Practical Machine Learning Tools and Techniques with Java implementations Witten,Ian H.;Frank,Eibe
  14. Neural Networks v.5 Stacked generaliztion Wolpert,David H. https://doi.org/10.1016/S0893-6080(05)80023-1
  15. Proceedings of the Fourteenth International Conference on Machine Learning A Comparative study on feature selection in text categorization Yang,Yiming;Pedersen,Jan O.