Definition of Relational Operators for Effective Extracting Data Mining Information from Relational Relational Database

관계형 데이터베이스에서 효과적 데이터 마이닝 정보 추출을 위한 관계 연산자의 정의

  • 송지영 (안산 1대학 웹프로그래밍과)
  • Published : 2001.02.01

Abstract

As the growth of database volume, it has required a need and an opportunity of data analysis and extracting knowledge from database. Data mining method is the representative example. The size of most minable data set is huge, and stored in a database. To implement effective mining function, we must extract minable data set to be analyzed from existing relational database, and it must be managed with its generalized information. In this paper, the new mining operator is defined in a similar manner to the existing SQL operators and SQL is extended to extract data subset from relations and to generalize it using domain-oriented method. The background knowledge includes attribute values, which will be mind and generalized information, and it is managed as the same structure with a relation in relational database. These functions are implemented by defining some SQL - like operators and aggregated functions, and we describe the expressive powers of these new operators and functions through examples.

데이터베이스의 크기가 증대함에 따라, 데이터의 분석 및 데이터베이스로부터의 지식 습득필요성이 대두되고 있다. 데이터 마이닝 기법은 그 대표적인 예이다. 대부분의 마이닝 대상 데이터 집합은 규모가 매우 크고, 데이터베이스 내에 저장되어 있다. 효과적인 마이닝 기능을 구현하기 위해서는 기존의 데이터베이스로부터 분석 대상 데이터 집합을 추출하고, 일반화시켜 함께 유지 관리함이 요구된다. 본 논문에서는 새로운 미이닝 연산자를 정의함으로써 기존 SQL 언어를 확장하여 릴레이션으로부터 분석 대상 데이터를 도메인 중심 방법으로 추출 후 일반화시킨다. 분석 대상 애트리뷰트 값과 일반화된 정보를 포함하는 배경지식은 관계형 데이터베이스의 릴레이션과 동일한 구조로 저장 및 관리된다. 또한 본 논문에서 제안된 배경지식 추출을 수행하는 SQL 유사 연산자와 집단 함수를 예제를 통하여 그 사용 예를 보임으로써, 마이닝 표현력을 나타낸다.

Keywords