DOI QR코드

DOI QR Code

CC-GiST: A Generalized Framework for Efficiently Implementing Arbitrary Cache-Conscious Search Trees

CC-GiST: 임의의 캐시 인식 검색 트리를 효율적으로 구현하기 위한 일반화된 프레임워크

  • Published : 2007.02.28

Abstract

According to recent rapid price drop and capacity growth of main memory, the number of applications on main memory databases is dramatically increasing. Cache miss, which means a phenomenon that the data required by CPU is not resident in cache and is accessed from main memory, is one of the major causes of performance degradation of main memory databases. Several cache-conscious trees have been proposed for reducing cache miss and making the most use of cache in main memory databases. Since each cache-conscious tree has its own unique features, more than one cache-conscious tree can be used in a single application depending on the application's requirement. Moreover, if there is no existing cache-conscious tree that satisfies the application's requirement, we should implement a new cache-conscious tree only for the application's sake. In this paper, we propose the cache-conscious generalized search tree (CC-GiST). The CC-GiST is an extension of the disk-based generalized search tree (GiST) [HNP95] to be tache-conscious, and provides the entire common features and algorithms in the existing cache-conscious trees including pointer compression and key compression techniques. For implementing a cache-conscious tree based on the CC-GiST proposed in this paper, one should implement only a few functions specific to the cache-conscious tree. We show how to implement the most representative cache-conscious trees such as the CSB+-tree, the pkB-tree, and the CR-tree based on the CC-GiST. The CC-GiST eliminates the troublesomeness caused by managing mire than one cache-conscious tree in an application, and provides a framework for efficiently implementing arbitrary cache-conscious trees with new features.

최근 메인 메모리 가격이 하락하고 용량이 크게 증가함에 따라 메인 메모리 데이터베이스에 기반한 응용이 급격히 증가하고 있다. 캐시 미스 (cache miss)는 CPU에서 액세스하고자 하는 데이터가 캐시에 존재하지 않아 메모리로부터 읽어 들이는 과정이며, 메인 메모리 데이터베이스의 성능 감소의 중요한 원인이다. 메인 메모리 데이터베이스에서의 캐시 미스를 줄이고 캐시를 최대한 활용하기 위하여 여러 가지 캐시 인식 트리들(cache conscious trees)이 제안되었다. 이러한 캐시 인식 트리들은 각각 특성이 다르므로 하나의 응용에서 둘 이상의 캐시 인식 트리들이 동시에 관리될 수 있다. 또한, 만약 기존의 캐시 인식 트리가 응용에서의 요구를 만족시키지 못하면 새로운 캐시 인식 트리를 구현하여야 한다. 본 논문에서는 캐시 인식하는 일반화된 검색 트리(Cache-Conscious Generalized Search Tree, CC-GiST)를 제안한다. CC-GiST는 디스크 기반의 일반화된 검색 트리 (Generalized Search Tree, GiST) [HNP95]를 캐시 인식하도록 확장한 것이며, 포인터 압축(pointer compression)과 키 압축(key compression) 기법을 비롯하여 임의의 캐시 인식 트리의 공통적인 기능 및 알고리즘들을 동시에 제공한다. CC-GiST를 기반으로 특정 캐시 인식트리를 구현하려면 그 트리에 해당된 기능만을 구현하면 된다. 본 논문에서는 CC-GiST를 기반으로 기존의 대표적인 캐시 인식 트리인 CSB+-트리, pkB-트리, CR-트리를 구현하는 방법을 기술한다. CC-GiST를 이용함에 따라 메인 메모리 데이터베이스 응용에서 여러 개의 캐시 인식 트리를 관리하는 번거로움에서 벗어날 수 있고, 응용의 요구에 따른 새로운 캐시 인식 트리를 최소한의 노력으로 효율적으로 구현할 수 있다.

Keywords

References

  1. A. Ailamaki, D. J. DeWitt, M. D. Hill, and D. A. Wood, 'DBMS on a Modem Processor: Where Does Time Go?' In Proc. Int'l Conf. on Very Large Data Bases (VLDB), pp. 54-65, Sept. 1999
  2. P. Bernstein et al., 'The Asilomar Report on Database Research,' SIGMOD Record, Vol. 27, No.4, pp. 74-80, Dec. 1998 https://doi.org/10.1145/306101.306137
  3. P. Bohannon, P. Mcilroy, and R. Rastogi, 'MainMemory Index Structures with Fixed-Size Partial Keys,' In Proc. ACM Int'l Conf. on Management of Data, ACM SIGMOD, pp. 163-174, May 2001 https://doi.org/10.1145/375663.375681
  4. P. A. Boncz et al. 'Database Architecture Optimized for the New Bottleneck Memory Access,' In Proc. Int'l Conf. on Very Large Data Bases (VLDB), pp. 54-65, Sept. 1999
  5. B. Calder, C. Krintz, S. John, and T. Austin, 'Cache-Conscious Data-Placement,' In Proc. Conf. on Architectural Support for Programming Languages and Operating Systems (ASPLOS), pp. 139-149, Oct. 1998 https://doi.org/10.1145/291006.291036
  6. T. M. Chilimbi, J. R. Larus, and M. D. Hill, Improving Pointer Based Codes through Cache-Conscious Data Placement, Technical Report, University of Wisconsin-Madison, Computer Science Department, 1998
  7. T. M. Chilimbi, J. R. Larus, and M. D. Hill, 'Making Pointer Based Data Structures Cache Conscious,' IEEE Computer, Vol. 33, No. 12, pp. 67-74, Dec. 2000 https://doi.org/10.1109/2.889095
  8. A. Guttman, 'R-Tree: A Dynamic Index Structure For Spatial Searching,' In Proc. ACM Int'l Conf. Management of Data, ACM SIGMOD, pp. 47-57, June 1984
  9. J. M. Hellerstein, J. F. Naughton, and A. Pfeffer, 'Generalized Search Trees for Database Systems,' In Proc. Int'l Conf. on Very Large Data Bases (VLDB), pp. 562-573, Sept. 1995
  10. K. Kim, S. K. Cha, and K. Kwon, 'Optimizing Multidimensional Index Trees for Main Memory Access,' In Proc. ACM Int'l Conf. on Management of Data, ACM SIGMOD, pp. 139-150, May 2001 https://doi.org/10.1145/376284.375679
  11. T. J. Lehman et al., 'A Study of Index Structures for Main Memory Database Management Systems,' In Proc. Int'l Conf. on Very Large Data Bases (VLDB), pp. 294-303, Aug. 1986
  12. J. Rao and K. A. Ross, 'Cache conscious indexing for decision-support in main memory,' In Proc. of the International Conference on Very Large Data Bases (VLDB), pp. 7-10, Sept. 1999
  13. J. Rao and K.A. Ross, 'Making $B^+$ -trees Cache Conscious in Main Memory,' In Proc. ACM Int'l Conf. on Management of Data, ACM SIGMOD, pp. 475-486, May 2000 https://doi.org/10.1145/335191.335449
  14. A. Shatdal, C. Kant, and J. Naughton, 'Cache Conscious Algorithms for Relational Query Processing,' In Proc. Int'l Conf. on Very Large Data Bases (VLDB), pp. 510-512, Sept. 1994