DOI QR코드

DOI QR Code

An Online Scaling Method for Improving the Availability of a Database Cluster

데이터베이스 클러스터의 가용성 향상을 위한 온라인 확장 기법

  • 이충호 (인하대학교 지능형 GIS 연구센터) ;
  • 장용일 (인하대학교 대학원 컴퓨터공학부) ;
  • 배해영 (인하대학교 전자계산공학과)
  • Published : 2003.10.01

Abstract

An online scaling method adds new nodes to the shared-nothing database cluster and makes tables be reorganized while the system is running. The objective is to share the workload with many nodes and increase the capacity of cluster systems. The existing online scaling method, however, has two problems. One is the degradation of response time and transactions throughput due to the additional overheads of data transfer and replica's condidtency. The other is and inefficient recovery mechanism in which the overall scaling transaction is aborted by a fault. These problems deteriorate the availability of shared-nothing database cluster. To avoid the additional overheads throughout the scaling period, our scalingmethod consists of twophases : a parallel data transfer phase and a combination phase. The parallel data transferred datausing reduces the size of data transfer by dividing the data into the number of replicas. The combination phase combines the transferred datausing resources of spare nodes. Also, our method reduces the possibility of failure throughout the scaling period and improves the availability of the database cluster.

온라인 확장 기법은 비공유 데이터베이스 클러스터에서 온라인 상태에서 새로운 노드를 추가하고 데이터 재조직을 수행함으로써 작업 부하를 분산시키거나 전체 트랜잭션 처리량을 늘리기 위한 기법이다. 그러나, 기존의 온라인 확장 기법에서는 과부하 상태의 노드에 데이터 전송과 일관성 유지에 대한 추가적인 부하가 발생됨으로써, 전체 시스템의 응답속도가 느려지고 노드의 결함 발생 가능성을 감소시키는 문제점이 있다. 본 논문에서는 비공유 데이터베이스 클러스터에서 높은 가용성을 위한 데이터 확장 기법으 제안한다. 제안딘 온라인 확장 기법은 확장 연산 수행 중에 발생되는 노드의 추가적 부하를 병렬 데이터 전송과정과 복제본의 완성 과정을 통해 분산시키고, 확장 중에 발생한 결함에 대해서 효율적인 회복을 수행함으로써 데이터베이스 클러스터의 가용성을 향상시킨다. 즉, 원본 노드의 데이터를 각 복제분이 저장된 노드들에서 동시에 전송함으로써 데이터 전송을 병렬화하고, 전송 영역을 서로 분배하여 원본 노드의 데이터을 각 복제본이 저장된 노드들에서 동시에 전송함으로써 데이터 전송을 병렬화사고, 전송영역ㅇ 버로 분배하여 원본 노드의 부하와 다른 트랜잭선에 대한 간섭을 줄인다. 또한, 온라인 확장 기법에서의 노드 결함에 대해 빠른 회복을 수행한다. 본 논문에서는 성능평가를 통해 제안 기법이 기존 기법에 비해 노드의 부하를 감소시켜 결함 발생 가능성을 낮추고, 온라인 확장 연산에 대한 회복 처리 시간을 단축하여 데이터베이스 클러스터의 가용성을 향상시킴을 보인다.

Keywords

References

  1. S. E. Bratsberg and R. humborstad, 'Online Scaling in a Highly Available Database,' Proceedings of the 27th International Conference on Very Large Database, pp.451-460, Sept., 2001
  2. Y. Breitbart and Henry F. Korth. 'Replication and Consistency : Being Lazy Helps Sometimes,' In Proceedings of the ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Tucson, Arizona, 1997 https://doi.org/10.1145/263661.263681
  3. J. Gray, P. Helland, D. Shasha, 'The Dangers of Replication and a Solution,' In Proc. of the ACM SIGMOD, pp.568-574, 1996 https://doi.org/10.1145/233269.233330
  4. Informix, 'Informix Extended Parallel Server 8.3,' Informix, http://www.Informix.com
  5. D.J. DeWitt and J. Gray, 'Parallel Database Systems: The Future of Database Processing or a Passing Fad,' Microsoft, http://research.microsoft.com/ - gray /CacmParallel DB.doc
  6. Y. Jang, C. Lee, J. Lee and H. Bae, 'Improved On-line Scaling Scheme in a Scalable and Highly Available Database,' Proceedings of the International Conference PDPTA '02, Las Vegas, Nevada, USA, pp.1345-1351, Jun., 2002
  7. B. Kemme and G. Alonso, 'Don't be lazy, be consistent: Postgres-R, a new way to implement database replication,' Proceedings of the International Conferenceon Very Large Databases, Cairo, Egypt, pp.134-143, Sept., 2000
  8. B. Kemme, 'Database Replication for Clusters of Workstations,' PhD thesis, Department of Computer Science, ETH Zurich, Switzerland, 2000
  9. B. Kemme, A. Bartoli and O. Babaoglu, 'Online reconfigu ration in replicated databases based on group communication,' Proceedingsof the International Conference on Dependable Systems and Networks, Goteborg, Sweden, pp. 117-126, Jul., 2001 https://doi.org/10.1109/DSN.2001.941398
  10. B. Kemme, G. Alonso, 'A New Approach to Developing and Implementing Eager Database Replication Protocols,' ACM Transaction On Database Systems, September, 2000 https://doi.org/10.1145/363951.363955
  11. M. L. Lee, M. Kitsuregawa and B. C. Ooi, 'Towards Self Tuning Data Placement in Parallel Database Systems,' Proceedings of ACM SIGMOD International Conference on Management of Data, Dallas, TX USA, pp.225-236, May, 2000 https://doi.org/10.1145/342009.335416
  12. M. Patino Martnez, R. Jimenez-Pens, B. Kemme and G. Alonso, 'Scalable replication in database clusters,' Proceedings of the 14th International Symposium on Distributed Computing, Toledo, Spain, pp.315-329, Oct., 2000
  13. M. T. Ozsu and P. Valduriez. 'Principles of Distributed Database System,' Prentice-Hall, 1999
  14. E. Pacitti, P. Minet and E. Simon, 'Fast algorithms for maintaining replica consistency in lazy master replicated databases,' Proceedings of International Conference on Very Large Database (VLDB 1999), Edinburgh, pp.126-137, Sept., 1999
  15. R. Jimnez-Peris, M. Patio-Martnez, B. Kemme and G. Alonso, 'Improving the Scalability of Fault-Tolerant Database Clusters,' Proceedings of the 22rd International Conference on Distributed Computing Systems, pp.477-484, Jul., 2002 https://doi.org/10.1109/ICDCS.2002.1022297
  16. N. Ponnekanti and H. Kodavalla, 'Online Index Rebulid,' Proceedings of ACM SIGMOD International Conferenceon Management of Data, Dallas, TX USA, pp.529-538, May, 2000
  17. G. H. Sockut and B. R. Iyer, 'A survey of online reorganization in IBM products and research,' IEEE Data Engineering Bulletin, Vol.19, No.2, pp.4-11, Mar., 1996
  18. H. Schwtman, 'CSIM User Guide: CSIM 19 Simulation Engine(C, C++ Version),' Mesquite Software, Inc., 2001
  19. J. Wang, M. Miyazaki, H. Kameda and J. Li, 'Improving Performance of Parallel Transaction Processing Systems by Balancing Data Load on Line,' Proceedings of 7th International Conference on Parallel and Distributed Systems, Iwate, pp.331-338, Japan, Jul., 2000 https://doi.org/10.1109/ICPADS.2000.857715
  20. K. Watkins, 'Discrete event simulation in C,' McGraw-Hill, 1993
  21. M. Wiesmann, F. Pedone, A. Schiper, B. Kemme, and G. Alonso, 'Understanding Replication in Databases and Distributed Systems,' In Proceedings of 20th International Conference on Distributed Computing Systems, pp.264-274, 2000 https://doi.org/10.1109/ICDCS.2000.840959
  22. R. Vandewall, 'Database Replication Prototype,' Masters thesis, Department of Mathematics and Computer Science, University of Groningen, Netherlands, 2000
  23. C. Zou and B. Salzberg, 'On-line reorganization of sparsely -populated B+-trees,' Proceedings of ACM SIGMOD Intemational Conference on Management of Data, Montreal, Canada, pp.l15-124, Jun., 1996