DOI QR코드

DOI QR Code

Performance Evaluation on the Learning Algorithm for Automatic Classification of Q&A Documents

고객 질의 문서 자동 분류를 위한 학습 알고리즘 성능 평가

  • 최정민 (인천대학교 컴퓨터공학과) ;
  • 이병수 (인천대학교 컴퓨터공학과)
  • Published : 2006.02.01

Abstract

Electric commerce of surpassing the traditional one appeared before the public and has currently led the change in the management of enterprises. To establish and maintain good relations with customers, electric commerce has various channels for customers that understand what they want to and suggest it to them. The bulletin board and e-mail among em are inbound information that enterprises can directly listen to customers' opinions and are different from other channels in characters. Enterprises can effectively manage the bulletin board and e-mail by understanding customers' ideas as many as possible and provide them with optimum answers. It is one of the important factors to improve the reliability of the notice board and e-mail as well as the whole electric commerce. Therefore this thesis researches into methods to classify various kinds of documents automatically in electric commerce; they are possible to solve existing problems of the bulletin board and e-mail, to operate effectively and to manage systematically. Moreover, it researches what the most suitable algorithm is in the automatic classification of Q&A documents by experiment the classifying performance of Naive Bayesian, TFIDF, Neural Network, k-NN

최근 인터넷의 보급으로 전자상거래가 대중들에게 나타났고 현재 기업들의 경영환경 변화를 주도하고 있다. 전자상거래에서는 기업이 고객과의 유지 및 관계 구축을 위하여 고객이 원하는 것이 무엇인가를 파악하고 그것을 고객에게 제안하는 여러 가지 고객 채널을 가지고 있는데, 그 중 게시판과 전자메일은 고객의 질의를 직접적으로 들을 수 있는 인바운드(Inbound) 정보로서 매우 중요한 채널로 다루어지고 있다. 그러나 현재 운영되는 전자상거래의 게시판과 전자메일은 체계적인 관리와 처리과정 없이 질의와 답변이 이루어지고 있는 실정이다. 따라서 본 연구에서는 이러한 문제점의 해결을 위해 인공지능 분야의 문서 분류에서 널리 사용되고 있는 기계학습 알고리즘 중 대표적인 나이브 베이지안(Naive Bayesian), TFIDF, 신경망, k-NN 알고리즘을 도입하여 전자상거래에서 존재하는 여러 가지 고객 질의의 카테고리를 자동으로 분류할 수 있도록 함으로써 관리자가 정확한 답변을 신속하게 처리할 수 있도록 하였다. 그리고 도입한 알고리즘의 고객 질의 문서 자동 분류 성능 실험을 통해 어떤 알고리즘이 우수한 분류 성능을 나타내는지 확인하였으며 실험 결과 나이브 베지이지안 알고리즘이 95%이상의 높은 분류 성능을 나타내는 것을 확인하였다.

Keywords

References

  1. 김병곤, 최 성, 'eCRM 시스템의 개념 및 발전 전망,' 정보처리학회지, 제8권, 제6호, pp.7-17, 2001
  2. 김무엽, 'eCRM에서의 고객접점관리와 영업촉진관리,' 정보처리학회지, 제8권 제6호, pp.18-24, 2001
  3. 이경전, '전자상거래 소프트웨어 에이전트,' 정보처리학회지, 제6권, 제1호, pp.54-62, 1999
  4. 이재호, '에이전트 시스템의 연구 및 개발 동향,' 정보과학회지 제18권, 제5호, pp.4-9, 2000
  5. 최중민, '에이전트의 개요와 연구방향,' 정보과학회지, 제15권, 제3호, pp.7-16, 1997
  6. W. Cohen, 'Learning Rules that Classify e-mail,' Proc. AAAI Spring Symposium Machine Learning and Information Access, pp.18-25, 1996
  7. R. H. Guttman, A. G. Moukas, and P. Maes, Agents as Mediators in Electronic Commerce, Electronic Markets, Vol. 8, No.1, pp.22-27, 1998 https://doi.org/10.1080/10196789800000007
  8. B. Krulwich and C. Burkey, 'The InfoFinder Agent: Learning User Interests through Heuristic Phrase Extraction,' IEEE Experts, Vol.12, No.5, pp.22-27, 1997 https://doi.org/10.1109/64.621224
  9. D. D. Lewis and M. Ringuette, 'A Comparison of Two Learning Algorithms for Text Categorization,' Proc. Third Annual Symposium on Document Analysis and Information Retrieval, pp.81-93, 1994
  10. A. McCallum and K. Nigam, 'A Comparison of Event Models for Naive Bayes Text Classification,' Proc. AAAI-98 Workshop on Learning for Text Categorization, Madison, WI, pp.41-48, 1998
  11. T. M. Michell, Machine Learning, The McGraw-Hill Company, 1997
  12. D. Mladenic, 'Personal WebWatcher : Design and Implementation,' Technical Report US-DP-7472, School of Computer Science, Carnegie-Mellon University, Pittsburgh, USA, October, 1996
  13. S. Myoung, J. Choi, and I. Kim, 'BClassifier: A Personal Agent for Bookmark Classification,' Proc. International Conference on Parallel and Distributed Systems(ICPADS2001), IEEE Compo. Soc., pp.713-718, 2001 https://doi.org/10.1109/ICPADS.2001.934888
  14. S. Russell and P. Norvig, 'Artificial Intelligence: A Modern Approach,' Prentice-Hall Series in AI, 1995
  15. M. Sahami, S. Dumais, D. Heckerman, and E. Horvitz, 'A Bayesian Approach to Filtering Junk e-mail,' Proc. AAAI Workshop on Learning for Text Categorization, Madison Wisconsin, pp.55-62, 1998
  16. T. Sandholm, 'eMediator : A Next Generation Electronic Commerce Server,' AAAI Workshop on AI in Electronic Commerce, Orlando, pp.46-55, 1999
  17. B. Sheth and P. Maes, 'Evolveing Agents for Personalized Information Filtering,' Proc. Ninth Conference on Artificial Intelligence for Applications (CAIA-93), IEEE Comp. Soc., pp.345-352, 1993 https://doi.org/10.1109/CAIA.1993.366590
  18. Y. Yang and J. O. Pedersen, 'A Comparative Study on Feature Selection in Text Categorization,' Proc. Fourteenth International Conference on Machine Learning(ICML-97), pp.142-420, 1997