DOI QR코드

DOI QR Code

Processing XML Queries Using XML Materialized Views : Decomposition of a Path Expression and Result Integration

XML 실체뷰를 이용한 XML 질의 처리 : 경로 표현식의 분할 처리 및 결과 통합

  • 문찬호 (중앙대학교 대학원 컴퓨터공학과) ;
  • 강현철 (중앙대학교 컴퓨터공학과)
  • Published : 2003.08.01

Abstract

As demand of XML documents in the Web increases, Web service applications that manage XML documents as their resource are increasing. The view mechanism for XML data could be considered for effective in query processing in these Web service applications. If the XML query results are maintained as XML materialized views and their relevant XML query is processed using them, the query response time could be reduced. There are two types of processing an in path expression, which is one of the core features of XML query languages, using XML materialized views. One is the type where the complete query result is obtained from the materialized view, and the other is the type where some of the result is obtained from the materialized view and the rest is from the underlying XML documents. In this paper, we investigate the second type. An XML query in this paper is an XML path expression which is one of the core features of XML query languages. We first describe the storage structures of the XML materialized views derived from the underlying XML documents in the XML repository. Then, we propose the algorithms to decompose a given XML query into the subquery against the materialized view and the subquery against the underlying XML documents, and to integrate the results of these subqueries. Through performance evaluation, we figure out the condition under which our XML query decomposition using materialized views is more effective than the conventional processing.

웹 상에서 XML 문서의 수요가 증가함에 따라 XML 문서를 자원으로 갖는 웹 서비스 응용들이 증가하고 있다. 이들 웹 서비스 응용에서 질의 처리 시 성능 향상을 위해 XML 데이타에 대한 뷰 메커니즘을 고려할 수 있다. XML 질의 결과를 실체뷰로 유지하고, 하부 XML 문서에 대한 원래의 질의를 관련된 실체뷰에 대한 질의로 변환하여 수행한다면 질의 응답시간을 줄일 수 있을 것이다. 실체뷰를 이용한 질의 처리의 유형으로는 $\circled1$ 실체뷰로부터 원하는 결과를 모두 얻을 수 있는 유형과 $\circled2$ 질의 결과의 일부는 실체뷰에 존재하지만 일부는 하부 XML 문서로 부터 검색해야 하는 유형이 있다. 본 논문에서는 두 번째 유형에 대하여 연구한다. 본 논문의 질의는 여러 XML 질의어들이 갖는 핵심적인 기능 중 하나인 XML 경로 표현식이다. 본 논문에서는 먼저, XML 저장소 내 하부 XML 문서들로부터 도출된 XML 실체뷰의 저장 구조를 제시 한 후, 주어진 XML 질의를 실체뷰에 대한 질의와 하부 데이타에 대한 질의로 분할하는 알고리즘과 분할 질의의 결과를 통합하는 알고리즘을 제시한다. 그리고, 성능 평가를 통하여 실체뷰를 이용한 질의 분할 처리가 성능 향상을 가져오는 조건을 구한다.

Keywords

References

  1. A. Gupta and I. Mumick, Materialized Views : Techniques, Implementations and Applications, MIT Press, 1999
  2. S. Abiteboul and A. Bonner, 'Objects and View', Proc. ACM SIGMOD Conf., pp.238-247, 1991
  3. S. Heiler and S. Zdonik, 'Objec Views : Extending the Vision', Proc. IEEE Int'I Conf. on Data Engineering, pp.86-93, 1990
  4. S. Abiteboul, 'On Views and XML', Proc. ACM Symp. on Principles of Database System, pp.39091, 1999 https://doi.org/10.1145/303976.303977
  5. S. Cluet, et al., 'Views in a Large Scale XML Repository', Proc. Very Large Data Bases(VLDB) Conf., pp.271-280, September, 2001
  6. D. Suciu, 'Query Decomposition and View Maintenance for Query Languages for Unstructured Data,' Proc. Very Large Data Bases(VLDB) Conf., pp.227-238, 1996
  7. Y. Zhuge and H. Garcia Molina, 'Graph Structured Views and Their Incremental Maintenance', Proc. Int'l Conf. on Data Eng., pp.116-125, 1998 https://doi.org/10.1109/ICDE.1998.655767
  8. S. Abiteboul et al., 'Incremental Maintenance for Materialized Views over Semistructured Data', Proc. Very Large Data Bases(VLDB) Conf., pp.38-49, 1998
  9. M. Fernandez et al., 'Efficient Evaluation of XML MIddle ware Queries', Proc. ACM SIGMOD Int'l Conf. on Management of Data, pp.103-114, 2001 https://doi.org/10.1145/375663.375674
  10. 임재국 외, '점진적 갱신에 기반을 둔 XML 형성뷰 관리 프레임워크', 정보처리학회논문지D, 제8-D권 제4호, pp.327-338, 2001
  11. 김수희 외, 'XML 실체뷰를 이용한 XQL질의 처리', 정보처리학회논문지D, 제8-D권 제5호, pp.461-472, 2001
  12. S.Boag et al., 'XQuery 1.0 : An XML Query Language,' http://www.w3.org/TR/xqeury, 2002
  13. A. Berglund et al., 'XML Path Language (XPath)2.0,' http://www. w3.org/TR/
  14. J. Robie et al., 'XML Query Language (XQL),' http://www.w3.org/TandS/QL/QL98/pp/xql.html, 1998
  15. Y. Papakonstantinou and V. Vassalos, 'Query Rewriting for Semistructured Data', Proc. ACM SIGMOD Int'l Conf. on Management of Data, pp.455-466, 1999 https://doi.org/10.1145/304182.304222
  16. D. Calvanese et al., 'Answering Regular Path Queries Using Views', Proc. Int'l Conf. on Data Eng., pp.389-398, 2000 https://doi.org/10.1109/ICDE.2000.839439
  17. D. Florescu et al., 'Query Containment for Conjunctive Queries with Regular Expressions', Proc. PODS, pp.139-148, Jun., 1998 https://doi.org/10.1145/275487.275503
  18. T. Milo and D.Suciu, 'Index Structures for Path Expressions', Proc. Int'l Conf. on Database Theory(ICDT), pp.277-295, 1999
  19. F. Rizzoio and A. Mendelzon, 'Indexing XML Data with ToXin', Proc. 4th Int'l Workshop on the Web and Databases, Santa Barabra, pp.66-73, 2001
  20. T. Shimura et al., 'Storage and Retrieval of XML Documents Using Object-Relational Databases', Proc. Database and Expert Systems Applications(DEXA), pp.206-217, 1999
  21. A. Deutsch et al., 'Storing Semistructured Data with STORED', Proc. ACM SIGMOD Int'l on Management of Data, pp.431-442, 1999 https://doi.org/10.1145/304182.304220
  22. J. Shanmugasundaram et al., 'Relational Databases for Querying XML Documents : Limitations and Opportunities', Proc. Very Large Data Bases (VLDB) Conf., pp.302-314, 1999