Abstract
The leveling of technical internet domain term with its aim to accumulate knowledge that machine can comprehend, which has been used widely in recent years. If stratify domain term weight, we believe that machine can manage and analyze in formation on its own using the ontology. In this paper, we propose an algorithm that allows us to extract properties of ontology weight from structured information already existing in web documents. In particular by stratification of the domain knowledge that is composed of property information, we were able to make the algorithm better and improve the quality of extraction results. In our experiments with 50 thousands targeted documents, we were able to extract property information with 94% confidence.
최근의 여러분야에서 검색되어지고 있는 인터넷 도메인 용어의 전문성의 표시화는 온톨리지를 통한 지식의 축적의 목표가 되고 있다. 도메인 용어의 중요성을 표시화 한다면 기계가 온톨리지를 이용하여 정보의 관리 및 해석을 스스로 하는 것이 가능할 것으로 본다. 본 논문에서는 온톨로지의 중요성 (weight)을 구성하는 속성을 확장된 퍼지를 사용하여 기존 웹문서의 구조정보로부터 추출하는 알고리즘을 제안하였다. 특히 속성정보로 구성된 도메인 지식을 표시화 함으로써 속성추출 알고리즘을 개선하고, 추출결과의 품질을 향상시킨다. 5만문서를 대상으로 제안된 알고리즘을 적용한 결과 약 94%의 신뢰도의 속성정보를 추출할 수 있었다.