DOI QR코드

DOI QR Code

An XML Query System in a Wrapper System for Integrating Heterogeneous Biological Databases

이질의 생물 정보원 통합을 위한 랩퍼 시스템에서의 XML 질의 처리 시스템

  • 박은경 (경상대학교 컴퓨터과학과 대학원) ;
  • 강동완 (미디어코러스(주)) ;
  • 정채영 (경상대학교 컴퓨터과학과 대학원) ;
  • 김현주 (진주산업대학교 컴퓨터공학부) ;
  • 배종민 (경상대학교 컴퓨터과학부/컴퓨터정보통신연구소)
  • Published : 2005.08.01

Abstract

In order to integrate distributed biological information sources physically or virtually, it is necessary to overcome the heterogeneity of information sources and support a superior generality and adaptation in order to satisfy user's various demands. In this paper, we present a flexible and general XML query engine of a wrapper system in designing the middleware system to integrate data as well as application programs. Since this query engine applies user-defined XML view, it is possible to composite flexible integrated query. The query processing in a wrapper requires view composition, query translation into local sources, and generation of XML documents from local query results. We present a query processing model based on the view tree, where the n views and the XML queries are represented by the view tree. Moreover, to confirm the generality of our query processing model, we present a methodology of query processing for relational databases, web sources, and application programs whose return types of query results are relational tuples or XML documents.

분산된 생물 정보원을 물리적으로 혹은 가상적으로 통합하기 위해서는 정보원들의 이질성을 해결해야 하며, 사용자의 다양한 요구를 수용할 수 있도록 범용성과 적응력이 뛰어나야 한다 본 논문에서는 데이터는 물론 응용 프로그램의 통합을 위한 미들웨어를 설계함에 있어서 랩퍼 시스템에서의 융통성 있는 범용 XML 질의 처리 엔진을 제시한다. 제시된 질의 처리 엔진은 사용자 정의 XML 뷰를 지원함으로서 융통성 있는 통합 질의 구성을 가능하게 한다. 질의 처리 과정은 뷰 합성, 지역 정보원에 대한 질의 변환, 그리고 결과 문서 생성과정을 동반하는데, 이를 위해 XML 뷰와 XML 질의어를 뷰 트리로 표현하는 XML 뷰 트리 기반의 질의 처리 모델을 제시한다. 그리고 제시된 질의 처리 모델의 범용성을 확인하기 위해 관계형 데이터베이스와 웹 정보원, 그리고 응용 프로그램에 대하여 정보원의 질의 결과 형이 관계형 튜플과 XML 문서인 경우에 대한 질의 처리 방법을 제시한다.

Keywords

References

  1. A.S.Kosky, I.A.Chen, V.M.Markowitz, E.Szeto, 'Exploring Heterogeneous Biological Databases : Tools and Application', Proc. of the 6th International Conference on Extending Database Technology, pp.3-5, 1998 https://doi.org/10.1007/BFb0101005
  2. B.Eckman, Z.Lacroix, L.Raschid, 'Optimized Seamless Integration of Biomolecular Data', Proc. of the IEEEE 2nd International Symfosium on Bioinformatics and Bioengineering Conference, pp.1-3, 2001 https://doi.org/10.1109/BIBE.2001.974408
  3. BLAST, [Online]. Available : http://www.ncbi.nlm.nih.gov/BLAST, 2004
  4. Entrez-Search and Retrieval System, [Online]. Available : http://www.ncbi.nlm.nih.gov/Entrez, 2004
  5. Eun-Koung Park, Don-Wan Kang, Chai-Young Jung, Jong-Min Bae, 'A Wrapper Model for Integrated Access to Biological Information Sources', The KIPS Transactions, Vol.11-D, No.4, pp.768-772, August, 2004
  6. I.A.Chen, V.M.Markowitz, 'An Overview of the Object-Protocol Model(OPM) and OPM Data Management Tools', Inform. Syst., Vol.20, No.5, pp.5-10, April, 1995 https://doi.org/10.1016/0306-4379(95)00021-U
  7. J.Shanmugasundaram, E. Shekita, R. Barr, M. Carey, B. Lindasy, H. Pirahesh, B. Reinwald, 'Efficiently Publishing Relational Data as XML Documents', VBDB Journal, Vol.10, No.2-3, pp.133-154, 2001
  8. J. Shanmugasundaram, J. Kiernan, E. Shekita, C. Fan, J. Funderburk, 'Querying XML Views of Relational Data', VLDB Conference, pp.261-270, 2001
  9. M. Carey, D. Florescu, Z. Ives, Y. Lu, J. Shanmugasundaram, E. Shekita, S. Subranmanian, 'XPERANTO: Publishing Object-Relational Data as XML', In Proc. of the Int. Workshop on the Web and Databases (WebDB), pp.105-110, May, 2000
  10. M. Frenandez, A. Morishima, D. Suciu, 'Efficient Evaluation of XML Middel-ware Queries', SIGMOD '01, pp.103-114, May, 2001 https://doi.org/10.1145/375663.375674
  11. M. Frenandez, W. Tan, D. Suciu, 'SilkRoute : Trading between Relations and XML', In WWW9, pp.723-745, May, 2000 https://doi.org/10.1016/S1389-1286(00)00061-X
  12. PDB, [Online], Available : http://www.rcsb.org/pdb/,2005
  13. SAX 2.0, 'Simple API for XML', [Online]. Available : http://www.saxproject, org/, 2002
  14. Thomas Hernandez, Subbarao Kambhampati, 'Integration of Biological Sources : Current Systems and Challenges Ahead', ASU CSE TR-03-005, pp.3-5, October, 2003
  15. Val Tannen, 'The Information Integration System K2', white paper, 'http://db.cis.upenn.edu/K2/papers.html', pp.4-5
  16. World-Wide Web Consotrium, 'XML Schema Part 0: Primet', [Online]. Available :http://www.w3c.org/TR/xmlschema-0/, W3C Recommendation, 2001
  17. World-Wide Web Consotrium, 'XML Schema Part 1: Structures', [Online]. Available : http://www.w3c.org/TR/xmlschema-1/, W3C Recommendation, 2001
  18. World-Wide Web Consotrium, 'XML Schema Part 2: Datatypes', [Online]. Available : http://www.w3c.org/TR/xmlschema-2/, W3C Recommendation, 2001
  19. World-Wide Web Consotrium, 'XQuery 1.0: An XMI Query Language', [Online]. Available : http://www.w3c.org/TR/xquery/, W3C Working Draft, 2003
  20. Zoe Lacroix, 'Biological Data Integration: Wrapping Data and Tools', IEEE Transaction on information technology in biomedicine, Vol.6, No.2, pp.2-4, June, 2002 https://doi.org/10.1109/TITB.2002.1006299