The Monitoring System for Informing the Change of Contents on the Web Sites

웹 사이트 컨텐츠 변경 모니터링 시스템

  • 김원중 (순천대학교 컴퓨터과학과) ;
  • 조이기 (순천대학교 컴퓨터과학과) ;
  • 손철수 (순천대학교 컴퓨터과학과)
  • Published : 2002.06.01

Abstract

Fast spreading of web made we get easily the vast amount of information all over the world, but quantity of great information on the Internet space is giving much troubles to recognize change of information that users are interested soon justly. That is, users must connect and examine one by one to relevant site to detect change of web documents that changes from time to time. Therefore, the development of Robot which accomplish Information change monitoring function that sense automatically changed contents and inform to user is required. In this paper, we designed and implemented Web site contents change monitoring system, which notify-automatically the change of Web documents to users through alarm or E-mail if user defines target URL to do monitoring, monitoring condition, monitoring period etc. And we presented the method that structure and classify Web Documents to semantic units using HTML Tag. Also, we introduced the concept of virtual key to manage position of word to watch some change efficiently.

웹의 급속한 보관은 전세계에 흩어져 있는 무한한 정보를 손쉽게 얹을 수 있도록 하였지만, 인터넷 공간의 엄청난 정보의 양은 사용자들이 관심을 가지고 있는 정보의 변경을 곧 바로 인식하는데 많은 어려움을 주고 있다. 즉, 사용자가 수시로 변하는 웹 문서의 변경을 탐지하기 위해서는 해당 사이트에 접속하여 일일이 검사하여야 한다. 따라서 웹에서 변화된 정보를 자동적으로 감지하여 사용자에게 알려주는 정보변화 감시(Information change monitoring)기능을 수행하는 로봇의 개발이 필요하다. 본 논문에서는 웹사이트 문서의 변경을 모니터링 하기 위하여 모니터링할 대상 URL, 모니터링 조건, 모니터링 주기 등을 사용자가 정의하면, 변경이 발생할 경우 사용자에게 알람이나 E- mail을 통하여 자동으로 통지하여 주는 웹 사이트 컨텐츠 변경 모니터링 시스템을 설계 및 구현하였다. 본 연구를 통하여 웹 문서를 의미있는 단위로 구조화시키는 변경 방법과 HTML 태그를 이용하여 의미있는 단위로 분류시키는 방법을 제시하였다.

Keywords

References

  1. Altavista. http://www.altaista.com/
  2. Greory Cobena, Serge Abiteboul, Amelie Marian, 'Detecting Changes in XML Documents', Verso Report number 194, 2001
  3. Laurent Mignet, Mihai Preda, Serge Abiteboul, Bernd Amann, Amelie Marian,' Acquisition and Maintenance of XML Data from the Web', Verso Report number 188, 2001
  4. HTML Tidy. http://www.w3.org/People/Raggett/tidy/
  5. World Wide Web Consortium. HyperText Markup Language(HTML) 4.1. http://www.w3.org/Markup/
  6. 김태훈, 최중민, '용자 편의의 인터넷 정보검색을 위한 지능형 웹 브라우징 에이전트', 정보과학회논문지(B) 제25권 제7호, 1998
  7. Mind-it, http://www.netmind.com/index.shtml
  8. TRACERLOCK, http://www.tracerlock.com/
  9. TOMCAT, http://jakarta.apache.org/tomcat/index.html
  10. SERVLET, http://java.sun.com/products/servlet/index.html
  11. MySQL, http://www.mysql.com/
  12. Red Hat Linux 7.2, http://www.redhat.com/