Retrieval Scheme of XML Documents Using Link Queries

링크 질의를 통한 XML 문서의 검색 기법

  • Mun, Chan-Ho (Dept.of Computer Engineering, Graduate School of Chungang University) ;
  • Gang, Hyeon-Cheol (Dept.of Computer Engineering, Chungang University)
  • 문찬호 (중앙대학교 대학원 컴퓨터공학과) ;
  • 강현철 (중앙대학교 컴퓨터공학과)
  • Published : 2001.08.01

Abstract

The XML that was proposed as a next-generation standard for describing Web documents is widely used in various Web-based applications. In addition, XML documents on the Web link each other by hyperlinks. The current works on XML focus on the XML storage system that can efficiently store, manage, and retrieve XML documents. However, the research on the query language that supports the XML links and on the XML retrieval systems to process the XML links, is little conducted until now. In this paper, we propose an extension of an XML query language for expressing the XML link query and its processing scheme. A link query is to retrieve contents from an XML document (a query document) and from the XML documents (referenced documents) that are referred to by the links in the query document. As far as retrieving from the referenced documents is concerned, the current practice is to manually generate queries to get the partial results, and to repeat such a procedure. The purpose of link query processing in this paper is to eliminate the manual work altogether in getting the complete query result. The performance analysis shows that our link query processing strategy outperforms the conventional approach including the manual tasks. The more links to the referenced documents and the more referenced documents there are in the site storing the query document, the more query processing time decreases.

Web 문서를 기술하기 위해 차세대 표준으로 제안된 XML은 Web 기반의 여러 응용 분야에서 널리 사용되고 있으며, Web 상의 XML 문서들은 서로 하이퍼링크를 통해 연결되어 있다. 현재까지 대부분의 XML 관련 연구들은 XML 문서의 효율적인 저장, 관리 및 검색을 위한 XML 저장 시스템을 대상으로 하고 있으며, XML 링크를 지원하는 질의어의 개발이나 링크를 활용한 XML 검색 시스템의 개발에 대한 연구는 미흡하다. 본 논문에서는, XML 링크 질의 표현을 위한 XML 질의어의 확장과 링크 질의 처리 기법을 제시한다. 링크 질의는 하나의 XML 문서(질의 문서)와 질의 문서 내의 링크로 참조되는 XML 문서(참조 문서)들의 내용을 검색하는 것이다. 참조 문서의 검색을 위해서 현재는, 참조 문서에 대한 질의를 수작업으로 생성, 처리, 그리고 그 결과의 리턴을 반복적으로 수행하는 방법이 사용되고 있다. 본 논문의 링크 질의 처리 목적은 한번의 질의 입력을 통해 추가적인 수작업 없이 참조 문서(들)에 대한 검색 결과까지 얻을 수 있는 기능을 제공하는 것이다. 기존 수작업 기반과 본 논문의 링크 질의 처리의 성능을 비교, 분석한 결과, 참조 문서로의 링크가 많을수록 수작업 기반에 비하여 질의 처리 시간이 줄어들고, 질의 문서가 저장된 사이트에 참조 문서가 많이 있을수록, 질의 처리 시간이 줄어들었다.

Keywords

References

  1. T. Bray et al., 'Extensible Markup Language(XML) 1.0,' http://www.w3.org/TR/1998/REC-xml-19980210, 1998
  2. C. Baru et al. 'XML-Based Information Mediation with MIX,' Proc. of the 1999 ACM SIGMOD Int'l Conf. on Mana-gement of Data, pp.597-599, Jun. 1999 https://doi.org/10.1145/304182.304590
  3. 이경하 외, 'XMF : XML기반 분산 이질 정보자원의 통합 프레임워크,' KDBC 2000 학술발표논문집, pp.262-270, 2000
  4. 오준환 외, '3계층 XML문서저장 시스템의 설계', 2000 춘계학술대회논문집, 한국정보처리학회, 2000
  5. 이용석 외, 'XML 문서저장 시스템의 설계 및 구현', '98 가을학술발표논문집, 한국정보과학회, Vol.25, No.2, pp.347-349, 1998
  6. J. Robie et al., 'XML Query Language (XQL),' http://www.w3.org/TandS/QL/QL98/pp/xql.html, 1998
  7. A. Deutsch et al., 'XML-QL : A Query Language for XML,' http://www.w3.org./TR/NOTE-xml-ql/, 1998
  8. J. Clark and S. DeRose, 'XML Path Language (XPath) Version 1.0,' http://www.w3.org/TR/xpath, 1999
  9. D. Chamberlin et al., 'XQuery : A Query Language for XML,' http://www.w3.org/TR/xquery, 2001
  10. D. Florescu and D. Kossmann, 'Storing and Querying XML Data Using an RDBMS,' Bulletin of the Technical Committe on Data Engineering, Vol.22, No.3, pp.27-34, 1999
  11. 윤정희 외, '객체지향 데이타베이스의 XML로의 표현', 2000 봄 학술발표논문집, 한국정보과학회, 제27권, 제1호, pp.143-145, 2000
  12. M. Fernandez et al., 'Catching the Boat with Strudel : Ex-perience with a Web-Site Management System,' SIGMOD Record, Vol.27, No.3, pp.414-425, 1998
  13. A. Sahuguet and F. Azavant, 'W4F : A WysiWyg Web Wrapper Factory,' http://cheops.cis.upenn.edu/ sahuguet/WAPI/wapi.ps.gz, 1999
  14. D. Florescu et al., 'Database Techniques for the World-Wide Web : A Survey,' SIGMOD Record, Vol.27, No.3, pp.59-74, 1998 https://doi.org/10.1145/290593.290605
  15. D. Chamberlin et al., 'Quilt : An XML Query Language for Heterogeneous Data Sources,' http://www.almaden.ibm.com/cs/people/chamberlin/quit_Incs.pdf, 2000
  16. S. DeRoes et al., 'XML Linking Language(XLink),' http://www.w3.org/TR/xlink, 1999
  17. S. DeRose et al., 'XML Pointer Language (XPointer),' http://www.w3.org/TR/WD-xptr, 1999
  18. 김은정, 배종민, 'XML 링크정보를 이용한 정보검색 색인기법의 설계,' 정보처리논문지, 제7권, 제7호, pp.2020-2027, 2000
  19. 김상준 외, 'XML 링크의 메타 데이타를 이용한 검색 시스템의 설계,' 2000 봄 학술발표논문집, 한국정보과학회, 제27권, 제1호, pp.157-159, 2000