DOI QR코드

DOI QR Code

WeXGene: Web-based XML Data Generator

WeXGene: 웹 기반 XML 데이터 생성기

  • 신선미 ((주)CNP차앤박화장품) ;
  • 정회진 (숭실대학교 대학원 컴퓨터학과) ;
  • 이상호 (숭실대학교 컴퓨터학부)
  • Published : 2005.04.01

Abstract

We need XML generate various kinds of XML data to evaluate XML database systems. Existing XML data generators are developed to generate XML data that are suitable for particular evaluation methods, and their functionalities are limited in terms of generating XML data This paper introduces a new XML data generator, WeXGene, that not only improves the drawbacks of existing data generators but also adds new data generation functionalities. For generating XML data WeXGene uses the user data files and the structure definition files, which specify SDTD(Symbolic DTD) or input parameters. The user data file is a text data file that has column data or row data. It is also possible that WeXGene generates XML data without accessing the user data file. This paper presents the design details, overall system architecture, and data generation process of WeXGene. An analytic comparison with other XML data generators is also presented.

XML 데이터베이스 시스템 성능 평가를 수행하기 위해서는 다양한 형태의 XML 데이터 생성을 필요로 한다. 기존 XML 데이터 생성기들은 특정 성능 평가에 적용 가능한 데이터만을 생성하고, 그 기능 또한 매우 제한적이다. 본 논문에서는 기존 XML 데이터 생성기들의 제한된 기능을 보완하고 동시에 새로운 기능들을 추가한 새로운 XML 데이터 생성기인 "WeXGene"을 제안한다. WeXGene은 열 단위 또는 행 단위의 데이터를 포함하는 사용자 데이터 화일 및 "SDTD(Symbolic DTD)" 또는 입력 파라미터를 명시한 구조 정의 화일을 이용하여 XML 데이터를 생성한다. 또한 사용자 데이터 화일 없이도 임의의 데이터론 포함하는 XML 데이터 생성이 가능하다. 본 논문은 WeXGene의 구체적인 설계 내용, 구조, 데이터 생성과정 등을 기술한다. 또한 타 XML 데이터 생성기와 기능을 비교 분석하였다.

Keywords

References

  1. B.B. Yao, M.T. Ozsu, and J. Keenleyside, 'XBench-A Family of Benchmarks for XML DBMSs,' Proceedings of the Efficiency and Effectiveness of XML Tools and Techniques and Data Integration over the Web-Revised Papers, pp.162-164, 2003 https://doi.org/10.1007/3-540-36556-7_14
  2. A. Schmidt, F. Waas, M. Kersten, M.J. Carey, L. Manolescu, and R. Busse, 'XMark: A Benchmark for XML Data Management,' Proceedings of the 28th International Conference on Very Large Databases, pp.974-985, 2002
  3. K. Runapongsa, J.M. Patel, H.V. Jagadish, Y. Chen, and S. Al-Khalifa, 'The Michigan Benchmark: Towards XML Query Performance Diagnostics,' Technical Report, University of Michigan, 2002
  4. 옥은택, 정회진, 이상호, '데이타베이스 벤치마크를 위한 데이터 생성기와 성능 평가', 정보처리학회논문지D, 제10-D권 6호, pp.907-916, 2003 https://doi.org/10.3745/KIPSTD.2003.10D.6.907
  5. D. Barbosa, A. Mendelson, J. Keenleyside, and K. Lyons, 'ToXgene: An Extensible Template-based Data Generator for XML,' Proceedings of the 5th International Workshop on the Web and Database, pp.49-54, 2002
  6. A. Aboulnaga, J.F. Naughton, and C. Zhang, 'Generating Synthetic Complex-structured XML Data,' Proceedings of the 4th International Workshop on the Web and Databases, pp.79-84, 2001
  7. D. Barbosa, 'ToXgene Template Specification Language,' Department of Computer Science, University of Toronto, Version 2.1, 2003
  8. D.C. Fallside. 'XML Schema part 0: Primer - W3C candidate recommendation, http://www.w3.org/TR/xmlschema-0/, 2000
  9. A.R. Schmidt, F. Waas, M.L. Kersten, D. Florescu, M.J. Carey, I. Manolescu, and R. Busse, 'Why and How to Benchmark XML Databases,' ACM SIGMOD Record, Vol.3, No.30, pp.27-32, 2001 https://doi.org/10.1145/603867.603872
  10. A. Aboulnaga, A.R. Alameldeen, and J.F. Naughton, 'Estimating the Selectivity of XML Path Expressions for Internet Scale Applications,' Proceedings of the 27th International Conference on Very Large Databases, pp. 591-600, 2001