A Automatic Document Summarization Method based on Principal Component Analysis

DOI QR코드

DOI QR Code

Kim, Min-Soo;Lee, Chang-Beom;Baek, Jang-Sun;Lee, Guee-Sang;Park, Hyuk-Ro

  • 발행 : 2002.08.01

초록

In this paper, we propose a automatic document summarization method based on Principal Component Analysis(PCA) which is one of the multivariate statistical methods. After extracting thematic words using PCA, we select the statements containing the respective extracted thematic words, and make the document summary with them. Experimental results using newspaper articles show that the proposed method is superior to the method using either word frequency or information retrieval thesaurus.

키워드

principal component analysis;document summarization;thematic word extraction

참고문헌

  1. Using Lexical chains for Text Summarization, proc. pp.10-17 Barzilay, R.;Elhadad, M.
  2. Proc. Association for Computational Linguistics pp.18-24 Automated Text Summarization in SUMMARIST Hovy, E.;Lin, C. Y.
  3. Journal of the Association for Computing Machinery v.16 no.2 pp.264-285 New methods in Automatic Extracting Edmundson, H. P. https://doi.org/10.1145/321510.321519
  4. 제9회 한글 및 한국어 정보처리 학술대회 pp.28-36 한국어 문서의 통계적 정보를 이용한 문서요약 시스템 구현 강상배;조혁규;권혁철;박재득;박동인
  5. Proc. 18th ACM-SIGIR A Trainable Document Summarizer Kupiec, J.;Pedersen, J.;Chen, F.
  6. 정보과학회지 v.15 no.10 pp.42-49 자동 요약 시스템 장동현;맹성현
  7. 연구개발정보센터 연구보고서 검색/요약/필터링을 위한 텍스트 이해 모형 및 처리 기술 개발 박혁로;신중호
  8. 연구개발정보센터 수사구조에 기반한 한국어 요약문 생성 양기주
  9. 다변량 통계자료분석 김기영;전명식
  10. Proceedings of ACM-SIGIR'98 pp.2-10 Advantages of Query Biased Summaries in Information Retrieval Tombros, A.;Sanderson, M.
  11. 제27회 정보과학회 봄 학술발표논문집(B) v.27 no.1 pp.339-341 단어공기정보를 이용한 자동화 문서요약 류동원;이종혁