DOI QR코드

DOI QR Code

Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법

  • 천윤우 ((주)데이타뱅크 시스템즈) ;
  • 홍동권 (계명대학교 컴퓨터공학)
  • Published : 2004.06.01

Abstract

Recently there has been some efforts to add XML full-text retrievals and XML updates into new standardization of XML queries. XML full-text retrievals plays an important role in XML query languages. of like tables in relational model an XML document has complex and unstructured natures. We believe that when we try to get some information from unstructured XML documents a full-text retrieval query is much more convenient approach than a regular structured query XML update is another core function that an XML query have to have. In this paper we propose an inverted index to support XML updates and XML full-text queries in relational environment. Performance comparisons exhibit that our approach maintains a comparable size of inverted indexes and it supports many full-text retrieval functions very well. It also shows very stable retrieval performance especially for large size of XML documents. Foremost our approach handles XML updates efficiently by removing cascading effects.

최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

Keywords

References

  1. T. Bray, J. Paoli, C. Sperberg-McQueen, 'Extensible Markup Lanauage(XML) 1.0,' http;//www.w3c.org/TR/1998/REC-xml-19980219, 198
  2. S. Abiteboul, D. Quass, J. McHugh, J. Widom, J. Wiener, 'The Lorel query language for semistructured data,' International Journal on Digital Libraries, 1997
  3. A. Deutsch, M. Fernandez, D. Florescu, A. Levy, D. suciu, 'A Query Language for XML,' Proceedings of 8th International World Wide Web Conference, 1999
  4. J. Clark, S. DeRose, 'XML path language(XPath) Version 1.0,' http://www.w3c.org/TR/1999/RFC-xpath-19991116, 1999
  5. J. Robie, D. Chambelin, D. Florescu, 'Quilt : an XML Query Languange,' 2000
  6. D. Chamberlin, D. Florescu, J. Robie, J. Simeon, M. Stefanescu, 'XQuery : a query language for XML,' Technical report, 2001
  7. A. Brown, M. Fuchs, J. Robie, P. Wadler, 'XML Schema : Formal Description,' http://www.w3c.org/TR/2001/WD-xmlschema-formal-20010320/, 2003
  8. D. Lipkin, J. Marsh, H. Tompson, N. WalshXSL, 'Transformations(XSLT) Version 1.0,' http://www.w3c.org/TR/1999/REC-xslt-19991116, 1999
  9. S. Buxson, 'XQuery and XPath Full-Text Requirements,' http://www.w3.org/TR/2003/WD-xquery-full-text-requirements-20030502/, 2003
  10. D. Florescu, D. Kossman, I. Manolescu, 'Integrating keyword search into XML query processing,' Proceedings of the 9th International World Wide Web Conference, 2000 https://doi.org/10.1016/S1389-1286(00)00069-4
  11. S. Yahia, P. Case, 'XQuery and XPath Full-Text Use Cases,' http://www.w3.org/TR/2003/WD-xmlquery-full-text-use-cases-20030214, 2003
  12. C. Zhang, J. Naughton, D. DeWitt, Q. Luo, G. Lohman, 'On supporting containment queries in relational database management systems,' Proceedings of the ACM SIGMOD International Conference on the Management of Data, 2001 https://doi.org/10.1145/375663.375722
  13. C. Seo, S. Lee, H. Kim, 'An efficient inverted index techniques for XML Documents using RDBMS,' Information and Software Technology 45, pp.11-22, 2001 https://doi.org/10.1016/S0950-5849(02)00157-X
  14. M. Yoshikawa, T. Amagasa, 'XRel : a path-based approach to storage and retrieval of XML Documents using relational database,' ACM Transactions on Internet Technology 1, pp.110-141, 2001 https://doi.org/10.1145/383034.383038
  15. Q. Li, B. Moon, 'Indexing and Querying XML Data for Regular Path Expressions,' Proceedings of the 27th VLDB Conference, 2001
  16. OASIS Home Page, Shakespeares's XML Document Reference, http://www.oasis-open.org/cover/bosakSahkespeare200.html, cited, Sep., 2003
  17. CS Department University of Trier, DBLP XML Document Reference, http://www.informatik.uni-trier.de/ley/db, cited, Sep., 2003
  18. MonetDB, Auction XML Document Reference, http://monetdb.cwi.nl/xml/Benchmark/benchmark.html, cited, Sep., 2003