DOI QR코드

DOI QR Code

Efficient Parallel Spatial Join Processing Method in a Shared-Nothing Database Cluster System

비공유 공간 클러스터 환경에서 효율적인 병렬 공간 조인 처리 기법

  • 정원일 (인하대학교 대학원 전자계산공학과) ;
  • 이충호 (인하대학교 지능형 GIS 연구센터) ;
  • 배해영 (인하대학교 컴퓨터공학과)
  • Published : 2003.08.01

Abstract

Delay and discontinuance phenomenon of service are cause by sudden increase of the network communication amount and the quantity consumed of resources when Internet users are driven excessively to a conventional single large database sewer. To solve these problems, spatial database cluster consisted of several single nodes on high-speed network to offer high-performance is risen. But, research about spatial join operation that can reduce the performance of whole system in case process at single node is not achieved. So, in this paper, we propose efficient parallel spatial join processing method in a spatial database cluster system that uses data partitions and replications method that considers the characteristics of space data. Since proposed method does not need the creation step and the assignment step of tasks, and does not occur additional message transmission between cluster nodes that appear in existent parallel spatial join method, it shows performance improvement of 23% than the conventional parallel R-tree spatial join for a shared-nothing architecture about expensive spatial join queries. Also, It can minimize the response time to user because it removes redundant refinement operation at each cluster node.

기존의 단일 대용량 데이터베이스 서버에 인터넷 서비스 사용자들이 과도하게 몰릴 경우 서버에 발생하는 네트워크 통신량의 증가와 자원 사용량의 급격한 증가로 인해 서비스 처리 시간의 지연 및 서비스의 중단 현상이 발생할 수 있다. 이러한 문제들을 해결하기 위해 저비용의 여러 단일 노드를 고속의 네트워크로 연결하여 고성능을 제공하는 공간 데이터베이스 클러스터가 대두되었으나, 단일 노드에서 처리할 경우 전체 시스템의 성능을 저하시킬 수 있는 고비용의 공간 조인 연산에 대한 연구가 필요하다. 본 논문에서는 공간 데이터의 특성을 고려한 데이터의 분할과 부분 중복 기법을 사용하는 비공유 공간 데이터베이스 클러스터 환경에서 고비용의 공간 조인 연산을 효율적으로 수행하기 위한 논리적 분할 영역 및 병렬 공간 조인 기법을 제안한다. 제안 기법은 기존의 병렬 광간 조인 기법에서 나타나는 노드간 작업 생성 및 할당 단계가 필요하지 않으며 추가적인 메시지 전송이 발생하지 않으므로 고비용의 공간 조인 질의에 대해 기존의 비공유 구조를 위한 병렬 R-tree 공간 조인 기법보다 23%의 성능향상을 보인다. 또한, 각 클러스터 노드에서의 중복 정제(Refinement) 연산을 제거하므로 사용자에게 빠른 응답을 제공한다.

Keywords

References

  1. Chan Gu Li, Load Balancing Method using Proximity of Query Region in Web GIS Clustering System, Master Thesis, Inha Univ., 2002
  2. H. J. LeeParallel Pipelined Spatial Join Method for Efficient Query Processing In Distributed Spatial Database Systems, Master Thesis, Inha Univ., 2002
  3. T. Brinkhoff, H. P.Kriegel, R. Schneider and B. Seeger, Multi-Step Proceesing of Spatial Joins, Proceedings of the ACM SIGMOD International Conference on Management of Data, pp.197-208, 1994 https://doi.org/10.1145/191839.191880
  4. T. Brinkhoff, H. P. Kriegel and B. Seeger, Parallel Processing of Spatial Joins using R-trees, Proceedings of the 12th International Conference on Data Engineering, New Orleans, Louisiana, USA, pp.284-292, 1996 https://doi.org/10.1109/ICDE.1996.492114
  5. K. Tamura, Y. Nakano, K. Kaneko and A. Makinouchi, The Parallel Processing of Spatial Selection for Very Large GeoSpatial Databases, ICPADS 2001, pp. 26-30, 2001 https://doi.org/10.1109/ICPADS.2001.934889
  6. Y. I. Jang, C. H. Lee, J. D. Lee and H. Y. Bae, Web GIS Cluster Design with Extended Workload-Aware Request Distribution(WARD) Strategy, Proceedings of KISS, pp. 304-306, 2001
  7. B. Kemme, Database Replication for Clusters of Workstations, Ph.D thesis, Department of Computer Science, ETH Zurich, Switzerland, 2000
  8. T. Brinkhoff and H. P. Kriegel, Efficient Processing of Spatial Joins Using R-trees, Proc. ACM SIGMOD International Conference On Management of Data, Washington, DC. pp.237-246, 1993 https://doi.org/10.1145/170035.170075
  9. Jin Deog Kim et al., 'A Study on Task Allocation of Parallel Spatial Joins using Fixed Grids', KIPS Journal, Vol.8-D, No.4, pp.347-360, 2001
  10. E. G. Hoel and H. Samet, 'Data-Parallel Spatial Join Algorithms', Proceedings of International Conference on Parallel Processing, pp.227-234, 1994 https://doi.org/10.1109/ICPP.1994.82
  11. L. Mutenda, M. Kitsuregawa, Parallel R-tree Spatial Join for a Shared-Nothing Architecture, 1999 Int'l Symposium on Database Applications, pp.429-436, 1999 https://doi.org/10.1109/DANTE.1999.844988
  12. Y. D. Seo, Implementation and Performance Evaluation of Parallel Spatial Join Algorithm using R-tree, Master Thesis, Pusan National Univ., 1999
  13. H. P. Kriegel, T. Brinkhoff and Ralf Schneider, 'Efficient Spatial Query Processing in Geographic Database Systm', Data Engineering Bulletin 16(3), pp.10-15, 1993
  14. Chung-Ho Lee, A Partial Replication Protocol and a Dynamically Scaling Method for Database Cluster Systems, Ph.D Thesis, Inha Univ., 2003
  15. Gunter von Bultzingsloewen, 'Optimizing SQL Queries for Parallel Execution', SIGMOD RECORD, Vol.18, No.4, Dec., 1989 https://doi.org/10.1145/74120.74123
  16. D. Ries and R. Epstein, Evaluation of distribution criteria for distributed database system, UBC/ERL Technical Report M78/22, UC Berkeley, May, 1978
  17. M. L. Lee, M. Kitsuregawa, B. C. Ooi, K. Tan, and A. Mondal, 'Towards Self-Tuning Data Placement in Parallel Database Systmes', Proceedings of the ACM SIGMOD Int'l Conf. on Management of Data, Dallas, Taxas, pp. 225-236, 2000 https://doi.org/10.1145/342009.335416
  18. L. Arge, O. Procepiue, B. S. Rarnaswamy, T. Suel and J. S. Vitter, 'Scalable Sweeping-Based Spatial Join', Proc. of VLDG conf., 1998
  19. J. M. Patel and D. J. DeWitt, Partition Based Spatial-Merge Join, Proc. of ACM SIGMOD, 1996 https://doi.org/10.1145/233269.233338