An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘

  • 문상호 (부산외국어대학교 컴퓨터공학부) ;
  • 이동규 (에이츠컴 자동화사업부, 제어팀) ;
  • 서영덕 (부산대학교 대학원 컴퓨터공학과)
  • Published : 2003.08.01


Spatial data mining, i.e., discovery of interesting characteristics and patterns that may implicitly exists in spatial databases, is a challenging task due to the huge amounts of spatial data. Clustering algorithms are attractive for the task of class identification in spatial databases. Several methods for spatial clustering have been presented in recent years, but have the following several drawbacks increase costs due to computing distance among objects and process only memory-resident data. In this paper, we propose an efficient grid cell based spatial clustering method for spatial data mining. It focuses on resolving disadvantages of existing clustering algorithms. In details, it aims to reduce cost further for good efficiency on large databases. To do this, we devise a spatial clustering algorithm based on grid ceil structures including cell relationships.

대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.



  1. Ng and J. Han, 'Efficient and Effective Clustering Method for Spatial Data Mining', Proc. of Int. Conf. on VLDB, pp. 144-155, 1994
  2. M.Ester, H.P.Kriegel, J.Sander and X.Xu, 'A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise', Proc. of Int. Conf. on KDD, pp. 226-231, 1996
  3. W. Wang, J. Yang and R. Muntz, 'STING : A Statistical Information Grid Approach to Spatial Data Mining', Proc. of Int'l conf. on VLDB, pp. 186-195, 1997
  4. R. Agrawal, J. Gehrke, D. Gunopulos and P.Raghavan, 'Automatic Subspace Clustering of High Dimensional Data Mining Application', Proc. of ACM SIGMOD, pp. 94-105, 1998
  5. Fayyad, U.M. et al., 'Advances in Knowledge Discovery and Data Mining,' AAAI Press/MIT Press, 1996
  6. W.Lu, J.Han and B.C.Ooi, 'Discovery of General Knowledge in Lage Spatial Databases', Proc. of Far East Workshop on Geographi Information Systems, pp. 275-289, 1993
  7. Kaufman L. and Rousseeuw P.J., Finding Groups in Data : au Introduction to Cluster Analysis, John Wiley & Sons, 1990
  8. 오병우, 한기준, 'H-SCAN : 지식 추출을 위한 해시-기반 공간 클러스터링 알고리즘', 정보과학회논문지, 제26권 제7호, p. 857-869, 1999
  9. 진두석, 장재우, '데이타 마이닝을 위한 대용량 고차원 데이타의 셀-기반 분류방법', 정보과학회 학술발표논문집, 제27권 제2호, pp. 192-194, 2000
  10. 이혜명, 박영배, '고차원 데이타에서 점진적 프로젝션을 이용한 클러스터링', 정보과학회 학술발표논문집, 제27권 제2호, pp.189-191, 2000
  11. 이동규, 정정수, 문상호, '셀-기반 공간클러스터링 방법', 정보과학회 학술발표논문집, 제28권 제1호, pp. 10-12, 2001
  12. 용환성, '데이터 마이닝', 그린출판사, 1998
  13. 이동규, 문상호, '데이타베이스에서 클러스터 생성을 위한 그리드 셀-기반 알고리즘', 정보과학회 영남지부 학술발표논문집, 제9권 제1호, pp. 153-158, 2001
  14. Spatial Join Benchmarking home page(