Efficient Processor Allocation based on Join Selectivity in Multiple Hash Joins using Synchronization of Page Execution Time

페이지 실행시간 동기화를 이용한 다중 해쉬 결합에서 결합률에 따른 효율적인 프로세서 할당 기법

  • Published : 2001.04.01

Abstract

다중 결합 질의에 포함된 다수의 결합 연산지를 효율적으로 처리하기 위해 서는 효율적인 병렬 알고리즘이 필요하다. 최근 다중 해쉬 결합 질의의 처리를 위해 할당 트리를 이용한 방법이 가장 우수한 것으로 알려져 있다. 그러나 이 방법은 실제 결합 시에 할당 트리의 각 노드에서 필연적인 지연이 발생되는 데 이는 튜플-시험 단계에서 외부 릴레이션을 디스크로부터 페이지 단위로 읽는 비용과 이미 읽는 페이지에 대한 해쉬 결합 비용간의 차이에 의해 발생하게 된다. 이들 사이의 실행시간을 가급적 일치시키기 위한 '페이지 실행시간 동기화'기법이 제안되었고 이를 통해 할당 트리 한 노드 실행에 있어서의 지연 시간을 줄일 수 있었다. 하지만 지연 시간을 최소화하기 위해 할당되어질 프로세서의 수 즉, 페이지 실행시간 동기화 계수(k)는 실제 결합 시의 결합률에 따라 상당한 차이를 보이게 되고 결국, 이 차이를 고려하지 않은 다중 해쉬 결합은 성능 면에서 크게 저하될 수밖에 없다. 본 논문에서는 결합 이전에 어느 정도의 결합률을 예측할 수 있다는 전제하에 다중 해쉬 결합 실행 시에 발생할 수 있는 지연 시간을 최소화 할 수 있도록 결합률에 따라 최적의 프로세서들을 노드에 할당함으로서 다중 해쉬 결합의 실행 성능을 개선하였다. 그리고 분석적 비용 모형을 세워 기존 방식과의 다양한 성능 분석을 통해 비용 모형의 타당성을 입증하였다.

Keywords

References

  1. Hui-I Hsiao, Ming-Syan Chen, 'Parallel Execution of Hash Joins in Parallel Databases,' IEEE Transactions on Parallel and Distributed System, Vol. 8, No. 8, pp.872-883, Aug. 1997 https://doi.org/10.1109/71.605772
  2. Hui-I Hsiao, Ming-Syan Chen, and Philip S. Yu, 'On Parallel Execution of Multiple Pipelined Hash Jois,' Proc. ACM SIGMOD, pp.185-199, May 1994 https://doi.org/10.1145/191839.191879
  3. Ming-Syan Chen, Ming-Ling Lo, Philip S. Yu, and Honesty C. Young, 'Using Segmented Right-Deep Trees for the Execution of Pipelined Hash Joins,' 18th International Conference on VLDB, pp.15-26, August 1992
  4. Ming-Syan Chen, P.S. Yu, and K.L. Wu, 'Scheduling and Processor Allocation for Parallel Execution of Multi-Join Queries,' Proc. 8th International Conf. Data Engineering, pp.58-67, Feb. 1992
  5. Ming-Syan Chen, Mingling Lo, Philip S. Yu, and Honesty C. Young, 'Applying Segmented Right-Deep Trees to Pipelining Hash Joins,' IEEE Trans. on Knowledge and Data Engineering, Vol. 7, No. 4, August 1995 https://doi.org/10.1109/69.404036
  6. Donovan A. Schneider and D.J. DeWitt, 'Tradeoffs in Processing Complex Join Queries via Hashing in Multiprocessor Database Machines,' Proceedings of the 16th VLDB Conference, pp.469-480, August 1990
  7. Mingling Lo, Ming-Syan Chen, C. V. Ravishankar, and Philip S. Yu, 'On Optimal Processor Allocation to Support Pipelined Hash Joins,' Proc. ACM SIGMOD, pp.69-78, May 1993 https://doi.org/10.1145/170035.170053
  8. D.J.DeWitt, and J. Gray, 'Parallel Database System : The future of High Performance Database System,' Comm. of ACM, pp.85-98, June 1992 https://doi.org/10.1145/129888.129894
  9. 이규옥, 원영선, 홍만표, '페이지 실행시간 동기화 기법을 이용한 다중 파이프라인 해쉬 결합', 정보과학회 논문지:시스템 및 이론, 제27권, 제 7호, pp. 639-649, 2000
  10. Kyuock Lee, Youngsun Weon, and Manpyo Hong, 'Multiple Pipelined Hash Joins Using Synchronization of Page Execution Time,' Int'l conf. PDPTA'2000, Vol. V, pp. 2863-2869, June, 26-29, 2000