DOI QR코드

DOI QR Code

Indexing of XML with B+-tree

B+-tree를 이용한 XML 색인기법

  • 권국봉 (계명대학교 컴퓨터 공학과) ;
  • 홍동권 (계명대학교 컴퓨터 공학과)
  • Published : 2006.02.01

Abstract

Computing paradigm shift to internet-based one has accelerated the use of XML in diverse applications. This phenomena has made the explosive increases of XML data and it triggered many active researches in maintaining very huge amount of XML data in turn. In this paper we present a persistent graph-based XML indexing lot data-centric XML data. In our approach we use 3 graphs to represent XML indexes and XML data itself. They are schema graph, data graph index. And then we have mapped those graphs to B+-trees the persistency. With our approach we can achieve linear query execution time with the increase of XML sizes.

인터넷을 바탕으로 하는 컴퓨팅 패러다임의 변환은 인터넷에서 디지털 정보 교환의 표준으로 확고한 자리를 굳힌 XML의 사용을 가속화시키고 있다. 이로 인해 XML 데이터의 양이 기하급수적으로 증가하고 보다 효율적으로 XML 데이터를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 대용량의 데이터 중심 XML를 효과적으로 관리하기 위한 방안으로 그래프 중심의 색인 방법을 연구, 제안한다. 논문에서 제안한 XML 색인은 XML 데이터와 XML 구조 정보를 크게 3개의 구성 성분으로 표현한 후, 메인 메모리 자료구조로 표현된 각 그래프들을 노드 아이디를 키로 사용하여 B+트리에 각 노드를 사상하고 B+트리를 디스크에 저장하여 이들 색인 모델에 대해 지속성을 부여하였다. 본 논문에서 제안한 색인 방법을 통해 XML 데이터의 크기에 따라 질의 처리시간이 선형적으로 증가하는 결과를 얻을 수 있었다.

Keywords

References

  1. Bray, T., Paoli, J, Sperberg-McQueen, C, 'Extens ible Markup Language(XML) 1.0,' http://www.w3 c.org/TR/199SIREC-xml-199S0219/
  2. Tuong Dao, Ron Sacks-Davis, James A. Thorn, 'An Indexing Scheme for Structured Documents a nd its Implementation.', Proceedings of the Fifth I nternational Conference on Database Systems for Advanced Applications(DASFAA '97), pp.125-134, 1997
  3. Tuong Dao, 'An Indexing Model for Structured D ocuments to Support Queries on Content, Structure and Attributes.', Proceedings of ADL '98, pp.SS-9 7, 1995
  4. Chow, J H., Cheng, J, Chang, D., Xu, J, 'Index Design for Structured Documents Based on Abstra ction.', Proceedings of the 6th International Confer ence on Database Systems for Advanced Applicati ons, pp.9S-96, 1999
  5. B. Cooper, N. Sample, M. J. Franlin, G. R. Hjaltas on, and M. Shadmon. 'A fast index for semi-struc tured data.' In Proceedings of the Conference on Very Large Data Bases, 2001: 341-350
  6. Chin-Wan Chung, Jun-Ki Min, and Kyuseok Shi m. 'APEX: An Adaptive Path Index for XML Dat a.' In Proceedings of the ACM SIGMOD Internatio nal Conference on the Management of Data, 2002: 121-132
  7. H. Garcia-Molina, J Hammer, K. Ireland, Y. Papa konstantinou, J. Ullman, and Jennifer Widom. 'Inte grating and Accessing Heterogeneous Information Source in TSIMMIS'. In Proceedings of the AAAI Symposium on Information Gathering. pages 61-64, 3 1995
  8. Jason McHugh, Serge Abiteboul, Roy Goldman, Da llan Quass, and Jennifer Widoll. 'Lore: A Databas e Management System for Semi-structured Data'. SIGMOD Record, 26(3), 1997
  9. Wolfgang Meier, eXist: An Open Source Native X ML Database, 'http://exist-db.org/''
  10. James Owen, Erik Voges, A Generic Indexing Mechanism For Persistent Java ' http://people.c s.uct.ac.za/~evoges/web/'
  11. Arnaud Sahuguet, 'Kweelt is a framework to query XML data', http://kweelt.sf.net/
  12. Cover, R, 'The XML cover pages,' http://oasi s-open.orglcover/xml.html/
  13. CS Department University of Trier Home Pag e, 'DBLP XML Document,' http://www.informat ikuni-trier.de/ley/db/
  14. Chen Qun, Andrew Lim, Kian Win Ong, 'D(k)- I ndex: An Adaptive Structural Summary for Grap h-Structured Data.', Proceedings of the 2003 AC M SIGMOD International Conference on Manage ment of Data, San Diego, California, USA, pp. 13 4-144, 2003
  15. Haixun Wang, Sanghyun Park, Wei Fan, Philip S. Yu, 'ViST: A Dynamic Index Method for Que rying XML Data by Tree Structures.', Proceeding s of the 2003 ACM SIGMOD International Confer ence on Management of Data, San Diego, Califor nia, USA, pp. 110-121, 2003