DOI QR코드

DOI QR Code

Design and Algorithm Implementation of a Distributed Information Retrieval System using Sequential Transferring Method(STM)

순차적 전달방식(STM)을 이용한 분산정보검색시스템의 설계 및 알고리즘 구현

  • 윤희병 (국방대학교 전산정보학과) ;
  • 김용한 (국방대학교 대학원 전산정보학) ;
  • 김화수 (아주대학교 정보통신대학원)
  • Published : 2004.08.01

Abstract

The distributed Information Retrieval System centrally controlled by mediator or meta search engine result in congestion of heavy traffic and int he problem of increment of cost for the reason of the design of complicated algorithm for central control and installation of hardware. So to figure out this problem, the way is needed that has independent retrieval functionality and can cooperate each other without dependency. In this paper, we overview a few works involved in distributed information retrieval system, then, implement algorithm and design the frame-work of distributed information retrieval system using sequential transferring method(STM) including multiple information retrieval system separated from central control. For this first of all, we present a web partition policy which devide and manage web logically and we present the sequential query processing way by means of illustration through changing numbered information retrieval system. Then, we also present 3-layered structure of framework and function and module of each layer suitable for information retrieval system. Last of ail, for effective implementation of STM algorithm we analysis module structure and present description of pseudocode of this, and show that the proposed STM algorithm works smoothly by demonstration of sequential query transfer process between servers.

분산검색시스템은 중재자 또는 메타검색엔진에 의한 중앙통제로 인하여 중앙 시스템에 트래픽이 집중된다. 또한 중앙통제를 위한 복잡한 알고리즘의 설계와 별도의 하드웨어 설치 등의 비용 증가 문제가 발생한다. 따라서 이러한 문제를 해결하기 위해 여러 검색시스템이 서로 독립적인 검색기능을 가지면서도 중앙의 통제를 받지 않으면서 상호 협조할 수 있는 방식이 필요하다. 본 논문에서는 분산검색시스템과 관련된 여러 연구를 살펴보고 다중의 정보검색시스템이 중앙의 통제를 받지 않는 순차적 전달방식(STM)을 이용한 분산정보검색시스템의 Framework를 설계하며 이와 관련된 알고리즘을 구현한다 이를 위해 먼저 웹을 논리적으로 분할하여 관리하는 웹 분할 정책을 제시하며, 검색시스템의 수에 따른 순차적인 질의 처리방식을 각각 예제를 통해 설명한다. Framework에 적합한 정보검색시스템의 3 Layer구조와 각 Layer별 기능과 모듈을 또한 제시한다. 마지막으로, STM 알고리즘의 효율적 구현을 위하여 모듈 구조를 분석하고 이의 pseudocode 표현을 제시하며 서버간 순차적 질의 전달 시연과정을 통해 제안한 SIM 알고리즘이 효율적으로 동작함을 보여준다.

Keywords

References

  1. ALTAVISTA : Main Page. http://www.altavista.com, 1996
  2. 김영철외, '최신정보검색론', 홍릉과학출판사, 2001
  3. 전우직, '디지털도서관 표준 프로토콜 Z39.50의 개요 및 구현방안,' KOSTI96, 1996
  4. 송광택, 이희주, 안성현, '분산통합검색을 위한 분산통합기 관리도구,' 제5회 한국과학기술정보 인프라워크샵, Dec., 2000
  5. C. Mic Bowman, Peter B. Danzig, Darren R. Hardy, Udi Manber, Michael F. Schwartz, 'The Harvest Information Discovery and Access System,' In Proc, 2nd Int. www conf., pp.763-771, Oct., 1994
  6. Keith L. Clark and Vasilios S. Lazarou, 'A Multi-Agent System for Distributed Information Retrieval on the World Wide Web,' In WETICE '97, Collaborative Agent in Distributed web Applications, IEEE Computer Society Press, 1997 https://doi.org/10.1109/ENABL.1997.630796
  7. T. Finin, Y. Labrou and J. Mayfield, 'KQML as an Agent Communication Language,' Software Agent, pp.291-316, 1997
  8. Soo-Won Lee, 'Information Gathering Agents for Distributed Systems,' Journal of the Industrial Technology Research Institute, Soong Sil Univ., Vol.31, pp.165-172, 2001
  9. Nobuyoshi Sato, Minoru Uehara, Yoshifumi Sakai, Hideki Mori, 'Distributed Information Retrieval by using Cooperative Meta Search Engines,' 21st International Conference on Distributed Computing System Workshops, 2001 https://doi.org/10.1109/CDCS.2001.918728
  10. Heebyung Yoon, Kilsup Lee, Hwa-Soo Kim, 'Analysis and improvement Ranking Algorithm from Web Mining System on the Hierarchical Web Environment,' International Symposium on Advanced Intelligent System, pp.455-458, 2003
  11. George T. Wang, F. Xie, F. Tsunoda, H. Maezawa, Akira K., 'Web search with personalization and knowledge,' 4th international symposium on Multimedia Software Engineering, 2002 https://doi.org/10.1109/MMSE.2002.1181600
  12. V. V. Raghavan, 'S.K.M.A critical analysis of vector space model for information retrieval,' Journal of the American Society for Information Science, 1996 https://doi.org/10.1002/asi.4630370502
  13. L. Page, S. Brin, R. Motwani and T. Winograd, 'The PageRank Citation Ranking : Bringing Order to the Web,' Stanford University, 1998