DOI QR코드

DOI QR Code

Research on supporting the group by clause reflecting XML data characteristics in XQuery

XQuery에서의 XML 데이터 특성을 고려한 group by 지원을 위한 질의 표현 기법에 대한 연구

  • 이민수 (이화여자대학교 컴퓨터학과) ;
  • 조혜영 (이화여자대학교 대학원 컴퓨터학과) ;
  • 오정선 (이화여자대학교 대학원 컴퓨터학과) ;
  • 김윤미 (이화여자대학교 컴퓨터학과) ;
  • 송수경 (이화여자대학교 컴퓨터학과)
  • Published : 2006.08.01

Abstract

XML is the most popular platform-independent data expression which is used to communicate between loosely coupled heterogeneous systems such as B2B Applications or Workflow systems. The powerful query language XQuery has been developed to support diverse needs for querying XML documents. XQuery is designed to configure results from diverse data sources into a uniquely structured query result. Therefore, it became the standard for the XML query language. Although the latest XQuery supports heavy search functions including iterations, the grouping mechanism for data is too primitive and makes the query expression difficult and complex. Therefore, this work is focused on supporting the groupby clause in the query expression to process XQuery grouping. We suggest it to be a more efficient way to process grouping for restructuring and aggregation functions on XML data. We propose an XQuery EBNF that includes the groupby clause and implemented an XQuery processing system with grouping functions based on the eXist Native XML Database.

현재 널리 채택되고 있는 XML은 플랫폼에 의존하지 않는 데이터 표현 형식으로 B2B 응용 프로그램이나 워크플로우 상황에서처럼 느슨하게 연결된(loosely coupled) 이기종 시스템 간에 정보를 교환하는 데 매우 유용하게 사용되고 있다. XML의 이러한 장점 때문에 점차 증가하는 XML에 대한 관리 및 검색에 대한 요구 사항에 대처할 수 있도록 강력한 질의 언어인 XQuery가 만들어졌다. 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 XML 데이터를 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되었으며 현재 XML 질의 언어의 표준이다. XQuery는 반복문 등을 포함하는 강력한 검색 기능을 지원하나 데이터를 그룹화 하는 경우에는 질의 표현이 상대적으로 어렵고, 복잡한 형태를 취한다. 따라서 본 논문에서는 XQuery에 그룹화 처리를 위한 명시적인 groupby절을 도입한 질의 표현 기법을 모색함으로써 XML 데이터의 재구성과 집계 함수 처리를 위한 그룹화를 보다 효율적으로 처리할 수 있도록 하였다. 이를 위해서 XQuery에 groupby절을 도입하기 위한 EBNF(Extended Backus-Naur Form)를 제안하고, 네이티브 XML 데이터베이스인 eXist 기반의 XQuery 그룹화 질의 처리 시스템을 구현하였다.

Keywords

References

  1. XML(eXtensible Markup Language), http://www.w3.org/XML/
  2. XQuery (XML Query Language), http://www.w3.org/XML/Query/
  3. eXist(An Open Source Native XML Database), http://exist.sourceforge.net
  4. XML Path Language (XPath) 2.0, http://www.w3.org/TR/2005/WD-xpath20- 20050404/
  5. J. McHugh, S. Abiteboul, R. Goldman, D. Quass and J. Widom, 'Lore: A Database Management System for Semistructured Data', SIGMOD Record, 26(3), pp.54-66, September, 1997 https://doi.org/10.1145/262762.262770
  6. H. V. jagadish, Shurug Al-Khalifa, Adriane Chapman, Laks V.S. Lakshmanan, Andrew Nierman, Stelios Paparizos, Jignesh M Patel, Divesh Srivastava, Nuwee Wiwatwattana, Yuqing Wu and Cong Yu. 'TIMBER: A Native XML Database', VLDB Journal, Vol.11, Issue 4, pp.274-291, 2002 https://doi.org/10.1007/s00778-002-0081-x
  7. D. Chatziantoniou and K. A. Ross, 'Querying multiple features of groups in relational databases', VLDB, pp.295-306, 1996
  8. D. Chatziantoniou and K. A. Ross, 'Groupwise processing of relational queries', VLDB, pp.476-485, 1997
  9. H. V. Jagadish, Laks V.S.Lakshmanan, Divesh Srivastava and Keith Thompson. 'TAX: A Tree Algebra for XML', In Proc. DBPL Conf., pp.149-164, Frascati, Italy, Sep. 2001
  10. Stelios Paparizos, Shurug Al-Khalifa, H. V. Jagadish, Laks Lakshmanan, Andrew Nierman, Divesh Srivastava and Yuqing Wu, 'Grouping in XML', In: EDBT 2002 Workshop on XML-Based Data Management (XMLDM'02), pp.128-147, 2002
  11. S. Chaudhuri, R. Kaushik and J.F. Naughton, 'On Relational Support for XML Publishing: Beyond Sorting and Tagging', SIGMOD, pp.611-622, 2003 https://doi.org/10.1145/872757.872831