시소러스 통합을 위한 개념기반 패싯 프레임워크 구축

Construction of the Concept-Based Faceted Framework for Thesaurus Integration

  • 이승민 (중앙대학교 문헌정보학과)
  • 투고 : 2010.08.27
  • 심사 : 2010.09.27
  • 발행 : 2010.09.30


각각의 시소러스가 지닌 고유한 특성 및 상이한 구축목적으로 인해서, 하나의 시소러스를 이용하여 특정 도메인의 정보를 조직하고 검색하는데 여러 가지 문제가 나타나고 있다. 시소러스의 통합은 이러한 문제를 해결하기 위한 한 가지 방법이 될 수 있다. 본 연구에서는 물리학 분야에서 널리 사용되고 있는 시소러스인 PACS와 PIRA를 선정하여 이들 시소러스를 개념적으로 통합할 수 있는 패싯 프레임워크를 구축하였다. 이들 두 시소러스를 연결하기 위해 물리학 분야 전체를 다룰 수 있는 계층구조를 구축하였고, 이 계층구조에 패싯분석을 적용함으로써 각각의 주제 사이의 관계를 설정할 수 있는 하나의 지식기반을 제공하고 있다. 또한, 이 개념기반 패싯 프레임워크를 통해 보다 효율적으로 정보를 조직하고 검색할 수 있는 접근방법을 제안하고 있다.

Applying one specific thesaurus might cause several problems because each thesaurus has its own characteristics inherited from its construction process. Therefore, integration of thesauri can be an appropriate approach to overcome the difficulties. This current research selected physics as a domain and two thesauri in the domain: PACS and PIRA. By integrating these two heterogeneous thesauri, this research could construct a conceptual structure that covers the whole concepts related to physics. By constructing the conceptual structure with the use of facet analysis from integrated thesaurus, it provides knowledge base with hierarchical structure and clear relationships between concepts. It can be an alternate approach to effective and efficient information retrieval and knowledge discovery.



