DOI QR코드

DOI QR Code

지지벡터기계(Support Vector Machines)를 이용한 한국어 화행분석

An analysis of Speech Acts for Korean Using Support Vector Machines

  • 발행 : 2005.06.01

초록

본 연구에서는 지지 벡터 기계(Support Vector Machines)를 이용하여 한국어 대화의 화행을 분석하는 방법을 제안한다. 우리는 발화의 어휘 및 품사와 이진 품사 쌍을 문장 자질로 사용하고 이전 발화의 문맥을 문맥 발화로 사용한다. 카이 제곱 통계량을 이용해 적절한 자질을 선택하고 선택된 자질로 지지 벡터 기계를 학습하였다. 학습된 지지 벡터 기계 분류기를 이용하여 각 발화의 화행을 분석하였다. 호텔 예약 영역의 말뭉치에 대해 제안된 시스템을 이용하여 실험한 결과 약 $90.54\%$의 정확률을 얻었다.

We propose a speech act analysis method for Korean dialogue using Support Vector Machines (SVM). We use a lexical form of a word, its part of speech (POS) tags, and bigrams of POS tags as sentence features and the contexts of the previous utterance as context features. We select informative features by Chi square statistics. After training SVM with the selected features, SVM classifiers determine the speech act of each utterance. In experiment, we acquired overall $90.54\%$ of accuracy with dialogue corpus for hotel reservation domain.

키워드

참고문헌

  1. Lambert, L. and S. Caberry. A Tripatite Plan-Based Model of Dialogue. In Proceedings of ACL, 1991. pp.47-54 https://doi.org/10.3115/981344.981351
  2. Chu-Carroll, J. and S. Carberry. Response Generation in Collaborative Negotiation. ACL-95, 1995 https://doi.org/10.3115/981658.981677
  3. 이재원, 통계적 화행처리를 이용한 대화체 기계번역에서의 효율적인 대화분석, 박사학위논문, 한국과학기술원, 1999
  4. Choi, Won Seug, Jeong-Mi Cho, and Jungyun Seo. Analysis System of Speech Acts and Discourse Structures Using Maximum Entropy Model. In Proceedings of the 37th Annual Meeting of the Association for computational Linguistics, 1999, pp.230-237 https://doi.org/10.3115/1034678.1034719
  5. Songwook Lee, Jungyun Seo, 'An analysis of Korean speech act using Hidden Markov Model with decision trees', In Proceedings of the 19 ICCPOL, pp.397-400. 2001
  6. Kyungsun Kim, Jungyun Seo, 'Feature selection in automatic speech act tagging', In Proceedings of the 19 ICCPOL, pp.379-383. 2001
  7. V. Vapnik. The nature of statistical learning theory, Springer, New York, 1995
  8. Joachims, T. http://svmlight.joachims.org
  9. Yang, Yiming and Jan O. Pedersen. A comparative study on Feature selection in text categorization. In proceedings of the 14th International conference on Machine Learning, 1997

피인용 문헌

  1. Spam Filter by Using X2Statistics and Support Vector Machines vol.17B, pp.3, 2010, https://doi.org/10.3745/KIPSTB.2010.17B.3.249