Analysis and Evaluation of Data Partitioning Methods or On-line Scaling in a Shared Nothing Database Cluster

비공유 데이터베이스 클러스터에서 온-라인 확장을 위한 데이터 분할 기법의 분석 및 평가

  • Jang, Yong-Il (Dept. of Computer Science and Engineering, Inha University) ;
  • Lee, Chung-Ho (Dept. of Computer Science and Engineering, Inha University) ;
  • Lee, Jae-Dong (Dept. of Computer Science, Dankook University) ;
  • Bae, Hae-Young (Dept. of Computer Science and Engineering, Inha University)
  • 장용일 (인하대학교 전자계산공학과) ;
  • 이충호 (인하대학교 전자계산공학과) ;
  • 이재동 (단국대학교 전산과) ;
  • 배해영 (인하대학교 전자계산공학과)
  • Published : 2002.11.15

Abstract

비공유 데이터베이스 클러스터는 그 구조의 특성 상 동적인 질의 패턴의 변화, 특정 데이터에 대한 질의 집중에 의한 부하 불균형 및 집중, 사용자 증가에 의한 처리량 한계 등의 문제가 발생한다. 이러한 문제를 해결하기 위해 데이터베이스 클러스터는 최근에 제안된 온-라인 확장기법을 사용하며, 이 기법은 데이터 베이스의 확장성에 의해 큰 영향을 받는다. 일반적으로 클러스터 시스템에서 사용되는 데이터 분할 기법에는 키 값의 순서대로 분할하는 라운드-로빈 분할 기법, 해쉬 함수를 이용해 데이터를 분할하는 해쉬 분할 기법, 범위에 따라 각 노드에 데이터를 분할하는 범위 분할기법, 그리고 조건식에 따라 데이터를 분할하는 조건식 분할 기법이 있다. 본 논문에서는 이 네 가지 분할 기법의 특성을 정리하고, 비공유 데이터베이스 클러스터에서 확장성에 있어서 우수한 분할 기법을 각 분할 기법의 성능평가를 통해 얻는다. 성능평가에서는 각각의 분한 기법을 평가하기 위해 확장 시 발생되는 이동 데이터의 크기, 질의처리에 대한 영향, CPU 사용률, 그리고 온-라인 확장기법의 수행 시 발생되는 특성에 대한 영향을 분석하며, 얻어진 결과를 토대로 비공유 데이터베이스 클러스터에서 가장 적합하면서도 온-라인 확장 기법적용을 위해 확장성이 우수한 데이터 분할기법을 찾는다.

Keywords