DOI QR코드

DOI QR Code

A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구

  • 양옥렬 (휴먼미디어테크) ;
  • 이용주 (원광대학교 컴퓨터 및 정보통신 공학부)
  • Published : 2002.12.01

Abstract

The goal of this study is to generate a structured document which improves the performance of an information retrieval system by using thesaurus, information on relations between words (terms), and to study on the technique for searching this structured document. In order to accomplish this goal, we propose a DODI (Depth -Oriented Decomposition Index) technique for the structured document and an algorithm to search for related information efficient]y through this index technique that uses a thesaurus. We establish a storage system by which the structured document generated by this index technique is saved in a database through OpenXML and XML documents are generated through ForXML methods.

본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

Keywords

References

  1. M. Gorden and P. Pathak, 'Finding information on the World Wide Web : the Retrieval Effectiveness of Search Engines,' Information Processing and Management, Vol. 35, No.2, pp.141-180, 1999 https://doi.org/10.1016/S0306-4573(98)00041-7
  2. H. Chen and V. Dhar, 'Online Query Refinement on Information Retrieval Systems : A Process Model of Searcher/System Interactions,' In Proceedings of the 13th Annual International ACM/SIGIR Conference, Brussels, Belgium, pp.115-133, 1990 https://doi.org/10.1145/96749.98013
  3. G. Salton and C. Buckley, 'Improving Retrieval Performance by Relevance Feedback,' Journal of the American Society for Information Science, Vol.41, No.4, pp.288-297, 1990 https://doi.org/10.1002/(SICI)1097-4571(199006)41:4<288::AID-ASI8>3.0.CO;2-H
  4. R. Davis, Intelligent Information System : Progress and Prospects, Ellis Horwood, 1986
  5. 류성호, '구조검색을 위한 XML 문서 저장 시스템의 설계 및 구현', 배제대학교 석사학위논문, 2000
  6. M. Hancock-Beaulieu M. Fieldhouse and T. Do, 'An Evaluation of Interactive Query Expansion in an Online Library Catalogue with a Graphical User Interface,' Journal of Documentation, Vol.5, No.3, pp.225-245, 1995
  7. J. Y. Nie and M. Brisebois, 'An Inferential Approach to Information Retrieval and its Implementation using a Manual Thesaurus,' Artificial Intelligence Review, Vol.10, No.5, pp.409-439, 1996 https://doi.org/10.1007/BF00130693
  8. H. J. Peat and P. Willett, 'The Limitation of Term Cooccurrence Data for Query Expansion in Document Retrieval System,' Journal of the American Society for Information Science, Vol.42, No.5, pp.378-383, 1991 https://doi.org/10.1002/(SICI)1097-4571(199106)42:5<378::AID-ASI8>3.0.CO;2-8
  9. D. A. Krooks and F. W. Lancaster, 'The Evolution of Guidelines for Thesaurus Construction,' Libri, Vol.43, No.4, pp.326-342, 1993 https://doi.org/10.1515/libr.1993.43.4.326
  10. Y. Qiu, 'Automatic Query Expansion Based on a Similarity Thesaurus,' Ph. D. Thesis, ETH Zurich, Institute of Computer Systems, 1995
  11. U. Miller, 'Thesaurus Construction : Problems and their Roots,' Information Processing and Management, Vol.33, No.4, pp.481-494, 1997 https://doi.org/10.1016/S0306-4573(97)00009-5
  12. Dario Lucarella, Antonella Zanti, 'A Visual Retrieval Environment for Hypermedia Information Systems,' ACM Transactions on Information Systems, Co.14, No.1, pp.3-29, 1996 https://doi.org/10.1145/214174.214175
  13. POET : Content Management Suite 2.0, POET Software, http://www.poet.com, 1999
  14. K. Shoens, A. Luniewshki, P. Schwarz, J. Stamos, J. Thomas, 'The Rufus System : Information Organization for Semi-Structured Data,' In Proceedings of the International Conference on Very Large Database(VLDB), pp.97-107, 1994
  15. eXcelon, eXcelon Corporation, http://www.odi.com, 1999
  16. Tamino, Software AG, http://www.softwareag.com, 1999
  17. K. Wang, L. Huiging, 'Discovering Typical Structures of Documents : A Road Map Approach,' ACM SIGIR conference R&D in IR, 1998 https://doi.org/10.1145/290941.290982
  18. 빈진영, '구조 기반 검색을 지원하는 XML DTD 데이터베이스의 설계 및 구현', 단국대학교 대학원 석사학위논문, 1999
  19. 박종관, 'XML 문서의 효율적인 구조 검색을 위한 색인 모델', 충북대학교 대학원 석사학위논문, 2001
  20. 김성욱, 'DOM 인터페이스를 이용한 XML 문서 저장시스템의 설계 및 구현', 한국외국어대학교 대학원, 2001