A Study on the Database Integration Methodology using XML

XML을 이용한 데이터베이스 통합방안에 관한 연구

  • Published : 2005.10.01

Abstract

Database Integration problems has been recognized as a critical issue for effective logistics service in logistics environment. However, researches related to effective methodology for this have been studied theoretically in the DB schema integration, are insufficient in the side of the system realization. The aim of this paper is to present a schema integration technique to integrate DB using XML(eXtensible Markup Language) in the part of practical DB integration, a quantitative methodology for the identification of conflict that is a representative problem on database integration. To achieve this aim, we extracted the entity name and attribute name from DB schema and suggested a quantitative methodology to easily fine name conflict that frequently give raise to a trouble when schema integration, based on the level of semantic similarity between attributes and entities.

물류환경에 있어서 데이터베이스 통합의 문제는 중요한 과제로 인식되어 왔으나, 기존 연구들은 스키마 통합 시 발생하는 스키마 충돌을 이론적인 측면에서의 해결 방법만 제시하고 실제 시스템 구현 측면에서의 연구는 부족한 실정이다. 본 연구는 실제적인 DB 통합법과 관련하여 XML 기술을 이용한 통합법을 제시하고 통합 알고리즘으로 개체 및 속성간의 유사도 측정에 기반을 둔 계량화된 충돌 식별법을 사용한다. 구체적으로 DB 스키마를 XML 스키마로 변환시켜 개체명과 속성명을 추출한 다음, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict) 현상인 이른바 "Name Conflict"의 식별을 위한 하나의 해결법으로서 시소러스(Thesaurus) 사전과 형태소 분석을 통해, 개체 및 속성 간 종합적인 유사도 측정하는 계량화된 식별방안을 사용하였다

Keywords