DOI QR코드

DOI QR Code

Enhancing Snippet Extraction Method using Fuzzy and Semantic Features

퍼지와 의미특징을 이용한 스니핏 추출 향상 방법

  • 박선 (목포대학교 정보산업연구소) ;
  • 이연우 (목포대학교 전자상거래학과) ;
  • 조광문 (목포대학교 정보통신학과) ;
  • 양후열 (목포대학교 전자상거래학과) ;
  • 이성로 (목포대학교 정보전자공학과)
  • Received : 2012.10.05
  • Accepted : 2012.10.25
  • Published : 2012.11.30

Abstract

This paper proposes a new enhancing snippet extraction method using fuzzy and semantic features. The proposed method creates a delegate of sentence by using semantic features. It extracts snippet using fuzzy association between a delegate sentence and sentence set which well represents query. In addition, the method uses pseudo relevance feedback to expand query which extracts snippet to be well reflected semantic user's intention. The experimental results demonstrate the proposed method can achieve better snippet extraction performance than the previous methods.

본 논문은 퍼지와 의미특징을 이용한 새로운 스니핏 추출의 성능향상 방법을 제안한다. 제안방법은 문장집합의 의미특징을 이용하여 대표문장을 생성하고, 대표문장과 문장집합의 퍼지관계를 이용함으로써 질의를 잘 나타내는 스니핏을 추출한다. 또한 의사연관 피드백을 이용하여 질의를 확장함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비해서 스니핏 추출에 더 좋은 성능을 보인다.

Keywords

References

  1. G. Manolache, "Index-based Snippet Generation", Master's Thesis, 2008.
  2. Y. J. Ko, H. K. An, J. Y. Seo, "Pseudo-relevance feedback and statistical query expansion for web snippet generation," Information Processing Letter. Vol. 109, pp.18-22, 2008. https://doi.org/10.1016/j.ipl.2008.08.004
  3. Q. Li, Y. P. Chen, "Personalized text snippet extraction using statistical language models," Pattern Recognition, Vol. 43, pp.378-386, 2010. https://doi.org/10.1016/j.patcog.2009.06.003
  4. T. Penin, H. Wang, T. Tran, Y. Yu, "Snippet Generation for Semantic Web Search Engine," In proceeding of ASWC, LNCS 5367, pp.493-507, 2008.
  5. Y. Huang, Z. Liu, "Query Baised Snippet Generation in XML Search," In proceeding of SIGMOD, pp.??, 2008.
  6. A. Turpin, Y. Tsegay, D. Hawking, H. E. Williams, "Fast Generation of Result Snippets in Web Search," In proceeding of SIGIR, pp.127-134, 2007.
  7. 박선, 심천식, 이성로, "연관피드백과 퍼지함의 연산자를 이용한 스니핏 추출 방법", 한국정보통신학회 논문지, 제16권 제3호, pp. 424-431, 2012
  8. 박선, 조광문, 양후열, 이성로, "의사연관 피드백과 퍼지 연관을 이용한 개인화 문서 스니핏 추출 방법", 전자공학회 논문지 제49권 SP편 제2호, pp.137-142, 2012
  9. D. D. Lee, H. S. Seung, "Algorithms for non-negative matrix factorization," In Advances in Neural Information Processing Systems, vol. 13, pp.556-562, 2001.
  10. C. Haruechaiyasak, M. L. Shyu, S. C. Chen, "Web Document Classification Based on Fuzzy Association", In proceedings of the 25th Annual International Computer Software and Applications Conference (COMPSAC'02) (2002)
  11. L. A. Zadeh, "Fuzzy Sets, in Dubois, D., Prade, H. and Yager, R. R. editiors, Readings in Fuzzy Sets for Intelligent Systems", Morgan Kaufmann Publiishers, 1993.
  12. B. Y. Ricardo, R. N. Berthier, "Moden Information Retrieval," ACM Press, 1999.
  13. W. B. Frankes, R. Baeza-Yaes, "Information Retrieval : Data Structure & Algorithms," Prentice-Hall, 1992.
  14. 한경남, 남경완, "한국어정보처리 입문 : 컴퓨터가 우리말을 이해하려면?", 커뮤니케이션북스, 2007.
  15. 야후 코리아, www.yhaoo.co.kr, 2011.