Analysis and Localization of freeWAIS-sf

FreeWAIS-sf의 분석 및 한글화

  • Published : 1999.10.01

Abstract

An efficient and effective access to needed information becomes an important factor in the modern information society. Many people have developed information retrieval (IR) systems that retrieve needed information from a large amount of data at a given time. However, most freely available IR systems have been developed for English text rather than for Korean text. In this research, we have analyzed the IR system freeWAIS-sf, and localized it with the Korean morphological analyzer, namely HAM. The localized freeWAIS-sf can handle both English text and Korean text simultaneously. We have also modified the weighting scheme of freeWAIS-sf. The experimental result shows that the modified weighting scheme outperforms the original one in terms of retrieval effectiveness.

원하는 정보에 대한 빠르고 정확한 접근은 정보화 사회를 살아가는 현대인들에게 성공의 여부를 결정짓는 중요한 요소가 되었다. 지금까지 대용량의 문서를 효율적으로 검색할 수 있는 정보 검색 시스템에 관한 많은 개발이 이루어져 왔다. 그러나, 연구용으로 자유롭게 이용될 수 있는 시스템들의 대부분이 영문 정보 검색 시스템으로 국한되어 있으며, 한영 혼용 정보 검색 시스템의 개발은 미흡한 실정이다. 본 연구에서는 영문 정보 검색 시스템 freeWAIS-sf를 분석하고, 한글 형태소 분석기 HAM을 이용하여 freeWAIS-sf를 한글화하였다. 또한 freeWAIS-sf의 가중치 기법을 변경하고, 변경된 가중치 기법이 보다 높은 검색 효과를 제공함을 실험을 통하여 입증하였다.

Keywords

References

  1. HAM: 한국어 형태소 분석 및 자동 색인 시스템 강승식
  2. 정보관리학회지 v.12 no.2 정보 검색 연구를 위한 KRIST 테스트 컬렉션의 개발 이준호;최광남;한현숙;김종원;남성원
  3. Center for Networked Information Discovery and Retrieval Wide Area Information Server Concepts B. Kahle
  4. In: Information Retrieval: Data Structures & Algorithms Extended Boolean Models E. Fox;S. Betrabet;M. Koushik;W.B. Frakes(ed.)
  5. Special Edition USING CGI J. Dwight;M. Erwin
  6. Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval Combining Multiple Evidence from Different Properties of Weighting Schemes J.H. Lee
  7. Department of Computer Science Analyzing the Effectiveness of Extended Boolean Models in Information Retrieval J.H. Lee
  8. Webmaster's Building Internet Database Servers with CGI J. Rowe
  9. The Enhance freeWAIS Distribution Edition 0.5 for freeWAIS-sf 2.0 U. Pfeifer
  10. Proceedings of the 3rd International WWW Conference Structured Documents with the Enhanced Retrieval Functionality of freeWAIS-sf and SFgate U. Pfeifer;N. Fuhr;T. Huynh
  11. Information Processing & Management v.24 no.5 Term Weighting Approaches in Automatic Text Retrieval G. Salton;C. Buckley