DOI QR코드

DOI QR Code

Modeling a Multi-Agent based Web Mining System on the Hierarchical Web Environment

계층적 웹 환경에서의 멀티-에이전트 기반 웹 마이닝 시스템 설계

  • 윤희병 (국방대학교 전산정보학과) ;
  • 김화수 (아주대학교 정보통신대학원)
  • Published : 2003.12.01

Abstract

In order to provide efficient retrieving results for user query on the web environment, the various searching algorithms have developed and considered user's preference and convenience. However, the searching algorithms are developed on the horizontal and non hierarchical web environment in general and could not apply to the complex hierarchical and functional web environments such like the enterprise network. In this paper, we purpose the multi-agent based web mining system which can provide the efficient mining results to the user on the special web environment. For doing this, we suggest the network model with the hierarchical web environment and model the multi agent based web mining system which has four corporation agents and fourteen process modules. Then, we explain the detailed functions of each agent considered the hierarchical environment according to the module. Especially, we purpose the new merging agent and improved ranking algorithm by using the graph theory.

웹 기반하에서 사용자의 질의에 대한 효율적인 검색결과를 제공하기 위하여 다양한 검색 알고리즘들이 개발되어 왔으며, 이러한 알고리즘들의 대부분은 사용자의 선호도나 편의성을 고려하였다. 그러나 지금까지 개발된 검색 알고리즘들은 일반적으로 웹이라는 수평의 비계층적인 웹 환경에서 개발된 것으로서 기업의 전사적 네트워크와 같이 계층적이고 기능적으로 복잡하게 구성되어 있는 웹 기반 환경에서는 적용하기가 힘든 실정이다. 본 논문에서는 이러한 특수한 웹 기반 환경하에서 사용자에게 효율적으로 마이닝 결과를 제공할 수 있는 멀티-에이전트 기반의 웹 마이닝 시스템을 제안한다. 이를 위해 우리는 계층적 웹 기반 환경이라는 네트워크 모델을 제시하며, 제시된 웹 환경에서 적용할 수 있는 4개의 협력 에이전트와 14개의 프로세스 모듈을 가진 멀티-에이전트 기반의 웹 마이닝 시스템을 설계한다. 그리고 각 에이전트에 대한 세부기능을 계층적 환경을 고려하여 모듈별로 설명하며 특히, 새로운 머징 에이전트와 개선된 랭킹 알고리즘을 그래프 이론을 적용하여 제안한다.

Keywords

References

  1. T. Witting, et. al., "ARCHON-A Framework for Intelligent Co- operation," Journal of Intelligent Systems Engineering-Special Issue on Real-time Intelligent Systems in ESPRIT, Vol. 3. No. 3, pp.168-179, 1994.
  2. Soon-Chul Baek, et. aI., "A Framework for Multi-agent Systems in Heterogeneous and Distributed Environment," Journal of KISS(C), Vol. 2. No. 1, pp.24-37, 1996.
  3. FIPA: FIPA 2000 Specification, 2000.
  4. Steve Lawrence, C. Lee Giles, "Searching the Web: General and Scientific Information Access," IEEE Communications Magazine. pp.116-122, 1999.
  5. Feng Guozhen, et. aI., "SAInSE: An Intelligent Search Engine Based on WWW Structure Analysis," International Symposium on Parallel and Distributed Processing, pp.1734-1740, 2001.
  6. Henry Tirri, "Search in Vain: Challenges for Internet Search," IEEE Computer, pp.115-116, 2003.
  7. Dik L. Lee, Huei Chuang, and Kent Seamons, "Document Ranking and the Vector-Space Model," IEEE Software, pp.67-75, 1997.
  8. Jon M. Kleinberg, "Authoritative Sources in a Hyperlinked Environment," Report RJ 10076, 1997.
  9. L. Page, S. Brin, R. Motwani, and T. Winograd, The PageRank Citation Rankings: Bringing Order to the Web," Tech, Report, Computer Science Department, Stanford University, 1998.
  10. Monika R. Henzinger, "Hyperlink Analysis for the Web," IEEE Internet Computing, pp.5-50, 2001.
  11. Ravi Kumar, Prabhakar Raghavan, Sridhar Rajagopalan, and Andrew Tomkins, "The Web and Social Networks," IEEE Computer, pp.32-36. 2002.
  12. S.Chakrabarti et aI., "Automatic Resource Compilation by Analyzing Hyperlink Structure and Associated Text," 7th International World Wide Web Conference, Computer Networks and ISDN Systems, vol. 30, No.1-7, pp.65-74, 1998.
  13. R. Lempel and S. Moran, "SALSA: The Stochastic Approach for Link-Structure Analysis," ACM Transactions on Information Systems, Vol. 19, No. 2, pp.131-160, 2001. https://doi.org/10.1145/382979.383041
  14. Soumen Chakrabarti, Martin van den Berg, and Byron Dom, "Focused Crawling: A New Approach to Topic-Specific Web Resource Discovery," 8th World Wide Web Conference, pp.545-562, 1999.