A Design and Implementation of XML Document storing and retrieval Framework based on a variant k-ary complete tree and RDF Metadata

가변 K진 완전트리와 RDF메타정보에 기반한 XML문서 저장 및 검색 프레임워크의 설계 및 구현

  • 김규태 (광운대학교 컴퓨터공학부) ;
  • 정회경 (배재대학교 정보통신공학부) ;
  • 이수연 (광운대학교 컴퓨터공학부)
  • Published : 2003.08.01

Abstract

This paper studied and proposed a XML document storing-and-retrieval framework based on a variant k-ary complete tree and a RDF metadata, which is composed of an effective storing module to store xml documents, a retrieving module to retrieve xml documents, and a connecting module to make this system intemperate in the web environment. In this storing module, DTD independent DOM based decomposition model using a method of addressing unique ill using a variant k-ary complete tree is adopted and is implemented. Query Processing Module includes a XPath query process and a content based retrieval function using word index for content information. To retrieve more exactly data, a structural retrieval using RDF metadata is adopted and implemented. In order to implement effectively XML document storing and retrieval system in the web environment, API using XML-RPC, API using HTTP's GET, PUT, POST and API using SOAP have been adopted and implemented.

XML문서가 표준 인터넷 문서로 정착되어 감에 따라 XML문서의 효율적인 저장과 검색의 필요성이 증대하고 있다. 이에 본 논문에서는 XML문서의 효과적인 저장 모듈과 검색 모듈, 그리고 이를 웹 상에서 연동해서 사용할 수 있는 연동 API로 구성된 XML문서의 저장 및 검색 프레임워크에 대한 연구를 하였다. 저장모듈에서는 가변 K진 완전트리를 기반으로 한 DTD 독립적인 분할-통합형 저장모델을 구현하였고, 검색 모듈에서는 RDF 메타정보를 통해 구축된 색인에 대해 XPath 질의를 수행하는 XPath처리기를 구현함으로써 좀더 의미 있는 구조 검색 기능을 구현하였으며, XML-RPC, HTTP의 GET, POST, PUT 방식 API와 SOAP 방식의 API로 구성된 웹 연동 모듈을 구현하였다.

Keywords

References

  1. ISO 8879, Information Processing Text and Office System Standard Generalized Markup System(SGML), 1986
  2. ISO 9069, 'SGML Document Interchange Format', 1988
  3. Dave Raggett, Arnaud le Hors,Ian Jacobs, 'HIML 4.01 Specification',World Wide Web Consortium Recommendation, 1999, Available at http://www.w3.org/TR/html401
  4. W3C, eXtensible Markup Language(XML)1.0, http://www.w3.org/1998/REC-xml/19980210.htm1, Feb,1998
  5. 이강찬, 손홍, 박기식,'XML 표준화 동향', 한국정보과학회지, 제19권 제1호, pp6-14, 2001
  6. RG.G. Gattell, Douglas K. Barry, 'The object database Standard: ODMG2.0, Morgan Kaufmann Publishers, Inc., 1997
  7. P. Florescu and D. Kossman, 'Storing and Querying XML Data using an RDBMS,' IEEE Data Engineering Bulletin 22(3), pp.27-34, 1999
  8. S. Malaika, 'Using XMLin Relational Database Applications,' 15th Int'l Conf. On Data Engineering, Sydney, Australia, p167, 1999
  9. T. Shimura, M. Yoshikawa, and S. Uemura, 'Storage and Retrieval of XML Documents Using Object-Relational Database,' DEXA99, pp.206-217, 1999
  10. J. Shanmugasundaram, K. Tufte, C. Zhang, G. He, D. J. DeWitt, and J.F. Naughton, 'Relational Databases for Querying XML Documents: Limitations and Opportunities, ' Proc, of 25th Int'l Conf. on VLDB, Edinburgh, Scotland, UK, pp.302-314, 1999
  11. 연제원, 조정수, 이강찬, 이규철, 'XML 문서 구조 검색을 위한 저장시스템 설계,' 한국 정보과학회 봄 학술발표 논문집(Ⅰ), 제 26권 1호, 1999
  12. 한상웅, 홍의경, 'ORDBMS를 이용한 XML 문서저장 시스템 설계', 한국 정보과학회 가을 학술발표 논문집(I) 제 27권 2호, 2000
  13. 김규태, 현득창, 이수연, 정광철, '관계형 데이터베이스를 이용한 SGML문서 처리', 한국정보과학회, 제 3권 제 3호 p238-p247
  14. 김훈, 홍의경, '객체관계형 데이터베이스를 이용한 XML 문서 저장 모델 설계,' 한국 정보과학회 가을 학술발표 논문집(I), 제 27권 2호, 2000
  15. 이용석, 손기락, 'XML문서 저장 시스템 설계 및 구현', 한국정보과학회 학술 논문집(I), 25권 2호, 1998
  16. M. Graves, Designing XML Databases, Prentice-Hall, 2001
  17. T.Amold-Moore, M, Fuller, B. Lowe, J. thorn, R. Wilkinson, 'The ELF data model and SGQL query language for structured document databases,' proceeding 6th australasian Database Conference, 1995
  18. GOMZALO NAVARRO, Richard Baeza -Yates, 'Proximal Nodes: A Model to Query Document Databases by Content and Structure,' ACM transactions on Information Systems, vol 15. No. 4, Oct,1997, pp.400-435 https://doi.org/10.1145/263479.263482
  19. Toung Dao, 'An Indexing Model for Structured documents to support Queries on Content, Structure and Attributes,' Proceeding of ADL 98, pp88-97,19
  20. Simon St.Laurent,Joe Johnston,Edd Dumbill, 'Programming Web Services with XML-RPC', O'Reilly,20