DOI QR코드

DOI QR Code

A Study on Clustering Query-answer Documents with Structural Features

문서구조를 이용한 질의응답문서 클러스터링에 관한 연구

  • 최상희 (연세대학교 문헌정보학과)
  • Published : 2005.12.01

Abstract

As the number of users who ask and give answers in the query-answer documents retrieval system is growing exponentially, the query-answer document become a crucial information resource, as a new type of information retrieval service. A query-answer document Consists of three structural parts : a query, explanation on query, and answers Chosen by users who asked the query. To identify the role of each structural part in representing the topics of documents, the three structural parts were clustered automatically and the results of several clustering tests were compared in this study.

이용자가 직접 참여하여 질의를 제공하고 응답을 하면서 공동으로 지식을 생산해내는 형태의 정보서비스는 응답된 내용이 축적되어 가면서 새로운 대용량 정보검색 분야로 성장하고 있다. 이 연구에서는 질의와 응답이 결합되어 있는 질의응답문서의 구조적 특성을 반영하여 질의응답문서의 효율적인 이용 방안을 도모하고자, 문서 구성요소인 질의제목, 질의설명, 응답내용을 기반으로 클러스터를 자동 생성하여 수작업 주제 범주와 비교한 후 각 구성요소의 주제 표현 성능을 평가하였다. 실험 결과 응답내용 클러스터링 결과가 수작업 결과와 가장 유사한 것으로 나타나 응답내용이 문서의 주제를 표현하는데 효과적인 것으로 분석되었다.

Keywords

References

  1. 노정순. 2004. OPAC에서 탐색결과의 클러스터링에 관한 연구. '한국문헌정보학회지', 38(1): 36-50
  2. 정영미, 이재윤. 2001. 클러스터링 성능 평가를 위한 비편향적 척도의 개발. '제8회 한국정보관리학회 학술대회 논문집', 167-172
  3. 정영미, 최상희. 2001. '문장 클러스터링에 기반한 자동요약 모형.' '정보관리학회지', 18(3): 159-177
  4. 최상희. 2004. 질의응답을 위한 복수문서 요약에 관한 연구. 연세대학교. 박사학위 논문
  5. Berztiss, A. T. 1993. 'The Query Language Vizla.' IEEE TKDE, 5(5): 813-825
  6. Bloesch, A. C., and T. A. Halpin. 1997. 'Conceptual Queries Using Conquer II.' Proceedings of the ER'97: 16th International Conference on Conceptual Modeling, (Los Angeles). 112-126
  7. Gopal, Ram D., and R. Ramesh. 1995. 'The Query Clustering Problem: A Set Partitioning Approach.' IEEE Transactions on Knowledge and Data Engineering, 7(6): 885-899 https://doi.org/10.1109/69.476495
  8. Kang, In-Ho, and GilChang Kim. 2003. 'Query Type Classification or Web Document Retrieval.' In Proceedings of the 26th Annual International ACM SIGIR Conference,. July 28 - August 1, 2003,Toronto, Canada. pp. 64-71
  9. Milligan, G. W., S. C. Soon, and L. M. Sokol. 1983. 'The Effect of Cluster Size, Dimensionality, and the Number of Cluster on Recovery of True Cluster Structure.' IEEE Transactions on Pattern Analysis and Machine Intelligence, 5(1): 40-47 https://doi.org/10.1109/TPAMI.1983.4767342
  10. Owei, Vesper. 2002. 'An Intelligent Approach to Handling Imperfect Information in Concep-Based Natural Language Queries.' ACM Transaction on Information Systems, 20(3): 291-328 https://doi.org/10.1145/568727.568729
  11. Tombros, Anastasios, and Mark Sanderson. 1998. 'Advantages of Query Biased Summaries in Information Retrieval.' In Proceedings of the 21st Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, 2-10
  12. Tombros, Anastasios, Robert Villa, and C. J. Van Rijsbergen. 2002. 'The Effectiveness of Query-Specific Hierarchic Clustering in Information Retrieval.' Information Processing & Management, 38(4): 559-582 https://doi.org/10.1016/S0306-4573(01)00048-6
  13. Roussinov, D., and H. Chen. 2001. 'Information Navigation on the Web by Clustering and Summarizing Query Results.' Information Processing & Management, 37(4): 789-816 https://doi.org/10.1016/S0306-4573(00)00062-5
  14. Wen, Ji-Ron, Jian-Yun Nie, and Hong-Jiang Zhang. 2001. 'Clustering User Queris of a Serach Engine.' In Proceedings of WWW10, pp.162-168
  15. Zhang, Ya-Jun, and Zhi-Qiang Liu. 2004. 'Refining Web Search Engine Results Using Incremental Clustering. International Journal of Intelligent Systems, 19(2): 191-199 https://doi.org/10.1002/int.10161