DOI QR코드

DOI QR Code

XML Fragmentation for Resource-Efficient Query Processing over XML Fragment Stream

자원 효율적인 XML 조각 스트림 질의 처리를 위한 XML 분할

  • 김진 (중앙대학교 컴퓨터공학과) ;
  • 강현철 (중앙대학교 컴퓨터공학부)
  • Published : 2009.02.28

Abstract

In realizing ubiquitous computing, techniques of efficiently using the limited resource at client such as mobile devices are required. With a mobile device with limited amount of memory, the techniques of XML stream query processing should be employed to process queries over a large volume of XML data. Recently, several techniques were proposed which fragment XML documents into XML fragments and stream them for query processing at client. During query processing, there could be great difference in resource usage (query processing time and memory usage) depending on how the source XML documents are fragmented. As such, an efficient fragmentation technique is needed. In this paper, we propose an XML fragmentation technique whereby resource efficiency in query processing at client could be enhanced. For this, we first present a cost model of query processing over XML fragment stream. Then, we propose an algorithm for resource-efficient XML fragmentation. Through implementation and experiments, we showed that our fragmentation technique outperformed previous techniques both in processing time and memory usage. The contribution of this paper is to have made the techniques of query processing over XML fragment stream more feasible for practical use.

유비쿼터스 컴퓨팅의 실현을 위해서는 이동 디바이스 등 클라이언트의 제약된 자원을 효율적으로 사용하는 기법이 요구된다. 메모리 용량이 크지 않은 이동 디바이스의 경우, 대용량 XML 데이터에 대한 질의 처리를 수행하기 위해서는 XML 스트림 질의 처리 기술의 활용이 필수적이다. 최근에 서버에서 XML 문서를 XML 조각(XML fragment)으로 분할하여 스트리밍하고 클라이언트에서 이 조각 스트림을 받아 질의를 처리하는 기법들이 제안되었다. XML 조각 스트림 질의 처리에 있어 XML 문서가 분할되는 방법에 따라 자원 사용(질의 처리 시간 및 메모리 사용량) 면에서 큰 차이가 날 수 있기 때문에 효율적인 XML 문서 분할 방법이 요구된다. 본 논문에서는 클라이언트의 질의 처리 시 자원 사용 효율을 높이기 위한 XML 문서 분할 기법을 제시한다. 이를 위하여 먼저 XML 조각 스트림 질의 처리의 비용 모델을 제시하고, 자원 효율적인 XML 문서 분할 알고리즘을 제시한다. 구현 및 성능 평가 결과 본 논문에서 제시한 기법이 기존 기법들에 비해 질의 처리 시간 및 메모리 사용량 양면 모두에서 우수한 것으로 나타났다. 본 논문의 기여는 XML 조각 스트림 질의 처리 기술의 실용화 가능성을 기존 기술에 비해 한 층더 높였다는 데 있다.

Keywords

References

  1. “XML Fragment Interchange,” W3C Candidate Recommendation 2001
  2. L. Fegaras, D. Levine, S. Bose, V. Chaluvadi, “Query Processing of Streamed XML Data,” CIKM, pp.126-133, 2002 https://doi.org/10.1145/584792.584816
  3. S. Bose, L. Fegaras, “XFrag: A Query Processing Framework for Fragmented XML Data,” Proc. WebDB, pp.97-102, 2005
  4. H. Huo, G. Wang, X. Hui, R. Zhou, B. Ning, C. Xiao, “Efficient Query Processing for Streamed XML Fragments,” Lecture Notes in Computer Science(LNCS) 3882, DASFAA, pp.468-482, 2006 https://doi.org/10.1007/11733836_33
  5. 이상욱, 김진, 강현철, “XML 레이블링을 이용한 XML 조각 스트림에 대한 질의 처리 기법,” 정보과학회논문지 : 데이타베이스, 제35권, 제1호, pp.67-83, 2008년 2월
  6. 이상욱, 김진, 강현철, “동적 XML 조각 스트림에 대한 메모리 효율적 질의 처리,” 정보처리학회논문지D, 제15-D권, 제1호, pp.1-14, 2008년 2월 https://doi.org/10.3745/KIPSTD.2008.15-D.1.1
  7. J.M. Bremer, M. Gertz, “On Distributing XML Repositories,” Proc. WebDB, pp.73-38, 2003
  8. H. Ma, K. D. Schewe, “Fragmentation of XML Documents,” Proc. SBBD, pp.200-214, 2003
  9. A. Andrade, G. Ruberg, F. Baiao, V. P. Braganholo, M. Mattoso, “Efficiently Processing XML Queries over Fragmented Repositories with PartiX,” Proc. EDBT, pp.150-163, 2006 https://doi.org/10.1007/11896548_15
  10. A. Bonifati, A. Cuzzocrea, “Efficient Fragmentation of Large XML Documents,” Proc. DEXA, pp.539-550, 2007 https://doi.org/10.1007/978-3-540-74469-6_53
  11. S. Abiteboul, O. Benjelloun, B. Cautis, I. Manolescu, T. Milo, and N. Preda, “Lazy Query Evaluation for Active XML,” Proc. ACM SIGMOD Int'l Conf. on Management of Data, 2004 https://doi.org/10.1145/1007568.1007596
  12. S. Hartmann, H. Ma, K. D. Schewe, “Cost-Based Vertical Fragmentation for XML,” Proc. APWeb/WAIM, pp.12-14, 2007 https://doi.org/10.1007/978-3-540-72909-9_2
  13. C. Li, T. W. Ling, “QED: A Novel Quaternary Encoding to Completely Avoid Re-labeling in XML Updates,” Proc. CIKM, pp.501-508, 2005
  14. P. O'Neil, E. Oneil, S. Pal, I. Cseri, G. Schaller, N. Westbury, “ORDPATHs: Insert-Friendly XML Node Labels,” Proc. ACM SIGMOD Int'l Conf. on Management of Data, pp. 903-908, 2004 https://doi.org/10.1145/1007568.1007686
  15. I. Tatarinov, S. D. Viglas, K. Beyer, J. Shanmugasundaram, E. Shekita, C. Zhang, “Storing and Querying Ordered XML Using a Relational Database System,” Proc. ACM SIGMOD Int'l Conf. on Management of Data, 2002, pp.204-215 https://doi.org/10.1145/564691.564715
  16. E. Y. C. Wong, A. T. S. Chan, H. V. Leong, “Efficient management of XML contents over wireless environment by Xstream,” Proc. SAC, pp.1122-1127, 2004 https://doi.org/10.1145/967900.968128
  17. E. Y. C. Wong, A. T. S. Chan, H. V. Leong, “Efficient management of XML contents over wireless environment by Xstream,” Proc. SAC, pp.1122-1127, 2004 https://doi.org/10.1145/967900.968128
  18. H. Huo, G. Wang, X. Hui, C. Xiao, R. Zhou, “Document Fragmentation for XML Streams Based on Query Statistics,” Lecture Notes in Computer Science(LNCS) 4255, WISE, pp.350-356, 2006 https://doi.org/10.1007/11912873_36
  19. L. Mignet, D. Barbosa, P. Veltri, “The XML Web: a First Study,” WWW 2003, pp.500-510
  20. A. Schmidt, F. Waas, M. Kersten, M. Carey, I. Manolescu, R. Busse, “XMark: A Benchmark for XML Data Management,” Proc. Int'l Conf. on VLDB, pp.974-985, 2002