A Study on Task Allocation of Parallel Spatial Joins using Fixed Grids

고정 그리드를 이용한 병렬 공간 조인의 태스크 할당에 관한 연구

  • Kim, Jin-Deok (Dept.of Computer Engineering, Dongeui University) ;
  • Seo, Yeong-Deok (Dept.of Computer Engineering, Graduate School of Busan National University) ;
  • Hong, Bong-Hui (Dept.of Computer Engineering, Graduate School of Busan National University)
  • 김진덕 (동의대학교 컴퓨터공학과) ;
  • 서영덕 (부산대학교 대학원 컴퓨터공학과) ;
  • 홍봉희 (부산대학교 컴퓨터공학과)
  • Published : 2001.08.01

Abstract

The most expensive spatial operation in spatial databases is a spatial join which computes a combined table of which tuple consists of two tuples of the two tables satisfying a spatial predicate. Although the execution time of sequential processing of a spatial join has been so far considerably improved, the response time is not tolerable because of not meeting the requirements of interactive users. It is usually appropriate to use parallel processing to improve the performance of spatial join processing. However, as the number of processors increases, the efficiency of each processor decreases rapidly because of the disk bottleneck and the overhead of message passing. This paper proposes the method of task allocation to soften the disk bottleneck caused by accessing the shared disk at the same time, and to minimize message passing among processors. In order to evaluate the performance of the proposed method in terms of the number of disk accesses and message passing, we conduct experiments on the two kinds of parallel spatial join algorithms. The experimental tests on the MIMD parallel machine with shared disks show that the proposed semi-dynamic task allocation method outperforms the static and dynamic task allocation methods.

공간 조인은 두 개의 데이터 집합으로부터 공간적인 조건을 만족하는 두 객체 쌍의 집합을 구하는 것으로 비용이 매우 큰 연산자이다. 지난 수년동안 공간 조인의 순차 수행 시간은 많이 향상되었지만, 그 응답시간은 사용자의 요구를 만족시키지 못하고 있다. 따라서 최근 병렬 시스템을 이용하여 이러한 문제를 해결하려는 연구가 진행되고 있다. 그렇지만 프로세서의 수가 증가할수록 병렬 처리에 의한 프로세서의 효율성은 급격히 떨어진다. 이것은 병렬 공간 조인을 수행할 경우 순차 공간 조인 보 다 디스크 병목 현상과 메시지 전송 오버헤드가 심하게 발생하기 때문이다. 이 논문에서는 공유 디스크 구조에서 다중 프로세서의 디스크 동시 접근으로 인한 병목 현상을 완화하고, 메시지 전송을 최소화하기 위한 태스크 할당 방법을 제안한다. 제안한 태스크 할당 방법을 두 가지 공간 조인 기법에 각각 적용하여 디스크 접근 횟수와 메시지 전송 횟수의 감소 효과를 실험으로 평가한다. MIMD 구조 및 공유디스크 방식의 병렬 시스템에서의 다양한 실험에서 이 논문에서 제안한 준동적 태스크 할당 방법이 정적 할당과 동적 할당 방법에 비해 우수함을 보였다.

Keywords

References

  1. L. Arge, O. Procopiuc, S. Ramaswamy, T. Suel, J. S. Vitter, 'Scalable Sweeping Based Spatial Join,' Proc. of Int. Conf. on VLDB, pp.570-581, 1998
  2. T. Brinkhoff, H. P. Kriegel, R.Schneider, B. Seeger, 'Effici-ent Processing of Spatial Joins Using R-trees,' Proc. of Int. Conf. on Management of Data, ACM SIGMOD, pp.237-246, 1993 https://doi.org/10.1145/170035.170075
  3. T. Brinkhoff, H. P. Kriegel, B. Seeger, 'Parallel Processing of Spatial Joins Using R-trees,' Proc. of Int. Conf. on Data Engineering, pp.258-265, 1996 https://doi.org/10.1109/ICDE.1996.492114
  4. D. J. DeWitt, 'DIRECT-A Multiprocessor Organization for Supporting Relational Database Management System,' IEEE Trans. on Computers, pp.395-406, 1979 https://doi.org/10.1109/TC.1979.1675379
  5. E. G. Hoel, H. Samet, 'Data-Parallel Spatial Join Algo-rithms,' Pro. of Int. Conf. on Parallel Processing, pp.227-234, 1994 https://doi.org/10.1109/ICPP.1994.82
  6. Y. W. Huang, N. Jing, E. A. Rundensteiner, 'A Cost Model for Estimating the Performance of Spatial Joins Using R-trees,' Proc. of Int. Conf. on SSDBM, pp.30-38, 1997 https://doi.org/10.1109/SSDM.1997.621148
  7. J. D. Kim, B. H. Hong, 'Parallel Spatial Join Algorithms using Grid Files,' Proc. of Int. Symp. on DANTE'99, pp.127-135, 1999 https://doi.org/10.1109/DANTE.1999.844964
  8. N. Koudas, K. C. Sevcik, 'Size Separation Spatial Join,' Proc. of Int. Conf. on Management of Data, ACM SIGMOD, pp.324-335, 1997 https://doi.org/10.1145/253260.253340
  9. R. Laurini, D. Thompson, 'Fundamentals of Spatial Infor-mation Systems,' Academic Press, 1992
  10. M. L. Lo, C. V. Ravishankar, 'Spatial Joins Using Seeded Trees,' Proc. of Int. Conf. on Management of Data, ACM SIGMOD, pp.209-220, 1994 https://doi.org/10.1145/191839.191881
  11. J. A. Orestein, 'Redundancy in spatial databases,' Proc. of Int. Conf. on Management of Data, ACM SIGMOD, pp.294-305, 1989 https://doi.org/10.1145/67544.66954
  12. J. M. Patel, D. J. Dewitt, 'Partition based spatial merge join,' Proc. of Int. Conf. on Management of Data, ACM SIGMOD, pp.259-270, 1996 https://doi.org/10.1145/233269.233338
  13. Y. Theodoridis, E. Stefanakis, T. Sellis, 'Cost Models or Join Queries in Spatial Databases,' Proc. of Int. Conf. on Data Engineering, pp.476-483, 1998 https://doi.org/10.1109/ICDE.1998.655810
  14. X. Zhou, D. J. Abel, David Truffet, 'Data Partitioning for Parallel Spatial Join Processing,' Proc. of Int. Conf. on SSD, pp.178-196, 1997 https://doi.org/10.1007/3-540-63238-7_30
  15. http : //epoch.cs.berkeley.edu : 8000/sequoia/benchmark/polygon/, Sequoia 2000 FTP sever home page
  16. 김진덕, 홍봉희, '단일/다중 할당 공간 색인에서 병렬 공간 조인의 성능 평가', 한국정보과학회논문지, 제26권 제6호, pp.763-779, 1999
  17. 서영덕, 김진덕, 홍봉희, '병렬 공간 조인을 위한 객체 캐쉬 기반 태스크 생성 및 할당', 한국정보과학회논문지, 제26권 제10호, pp.1178-1192, 1999