A Signature Method for Efficient Preprocessing of XML Queries

XML 질의의 효율적인 전처리를 위한 시그너처 방법

  • 정연돈 (동국대학교 컴퓨터멀티미디어공학과) ;
  • 김종욱 (LG전자 디지털미디어연구소) ;
  • 김명호 (한국과학기술원 전산학과)
  • Published : 2003.10.01

Abstract

The paper proposes a pre-processing method for efficient processing of XML queries in information retrieval systems with a large amount of XML documents. For the pre-processing, we use a signature-based approach. In the conventional (flat document-based) information retrieval systems, user queries consist of keywords and boolean operators, and thus signatures are structured in a flat manner. However, in XML-based information retrieval systems, the user queries have the form of path query. Therefore, the flat signature cannot be effective for XML documents. In the paper, we propose a structured signature for XML documents. Through experiments, we evaluate the performance of the proposed method.

본 논문은 대량의 XML 문서들이 존재하는 정보 검색 시스템에서, XML 질의의 효과적인 처리를 위한 선 처리 방법을 제안한다. 선 처리를 위해 시그너처 기반의 접근 방식을 사용한다. 기존의 (평면적인 문서를 사용하는) 정보 검색 시스템에서는, 대부분 사용자 질의들이 키워드와 부울 연산자로 구성되고, 따라서 시그너처 역시 평면적인 형태로 구성하고 있다. 하지만, XML 기반의 정보 검색 시스템에서는 사용자 질의가 경로 질의의 형태를 띄게 된다. 따라서, 평면적인 시그너처는 XML 문서에 대하여 효과적이지 못하다 본 논문에서는 XML 문서를 위한 구조화된 시그너처 방법을 제안한다. 실험을 통해 제안하는 방법의 성능을 평가한다.

Keywords

References

  1. Tim Bray, et. al., Extensible markup language (XML) 1.0 second edition W3C recommendation. Technical Report REC-xml-20001006, World Wide Web Consortium, 2000
  2. W3C. Document Object Model (DOM), http://222.w3.org, Feb. 2000
  3. S. Abiteboul, et. al., 'The Lorel query language for semistructured data,' International Journal on Digital Libraries, Vol. 1, No. 1, pp. 68-88, 1997 https://doi.org/10.1007/s007990050005
  4. Stefano Ceri, et. al., 'XML-GL: A graphical language forquerying and restructuring XML documents,' In proceedings of the 8th International World Wide Web Conference, pp. 93-109, 1999
  5. Don Chamberlin, et. al., XQuery: A Query Language for XML, W3C working draft. Technical Report WD-query-20010215, World Wide Web Consortium, 2001
  6. Quanzhong Li and Bongki Moon, 'Indexing and Querying XML Data for Regular Path Expressions,' In proceedings of the 27th VLDB Conference, pp. 361-370, 2001
  7. Daniel Florescu and Donald Kossmann, A performance evaluation of alternative mapping schemes for storing XML data in a relational database. Technical Report 3680, INRIA, Rocquencourt, France, 1999
  8. Christos Faloutsos, 'Signature files: Design and performance comparison of some signature extraction methods,' In proceedings of ACM SIGMOD, pp. 63-82, 1985 https://doi.org/10.1145/318898.318903
  9. Sangwon Park and Hyung-Joo Kim, 'A New Query Processing Technique for XML Based on Signature,' In proceedings of DASFAA, pp. 22-31, 2001 https://doi.org/10.1109/DASFAA.2001.916360
  10. 'Apach XML Project,' http://xml.apache.org
  11. 'DocBook DTD,' http://www.docbook.com
  12. A. L. Diaz, and D. Lovell, 'XML Generator,' http://www.alphaworks.ibm.com/tech /xmlgenerator