DOI QR코드

DOI QR Code

Shadow Recovery for Column-based Databases

컬럼-기반 데이터베이스를 위한 그림자 복구

  • Byun, Si-Woo (Division of Digital Media, Anyang University)
  • 변시우 (안양대학교 디지털미디어학과)
  • Received : 2015.01.18
  • Accepted : 2015.04.09
  • Published : 2015.04.30

Abstract

The column-oriented database storage is a very advanced model for large-volume data transactions because of its superior I/O performance. Traditional data storages exploit row-oriented storage where the attributes of a record are placed contiguously in hard disk for fast write operations. However, for search-mostly data warehouse systems, column-oriented storage has become a more proper model because of its superior read performance. Recently, solid state drive using flash memory is largely recognized as the preferred storage media for high-speed data analysis systems. In this research, we propose a new transaction recovery scheme for a column-oriented database environment which is based on a flash media file system. We improved traditional shadow paging schemes by reusing old data pages which are supposed to be invalidated in the course of writing a new data page in the flash file system environment. In order to reuse these data pages, we exploit reused shadow list structure in our column-oriented shadow recovery(CoSR) scheme. CoSR scheme minimizes the additional storage overhead for keeping shadow pages and minimizes the I/O performance degradation caused by column data compression of traditional recovery schemes. Based on the results of the performance evaluation, we conclude that CoSR outperforms the traditional schemes by 17%.

컬럼-기반 데이터베이스 저장소는 우수한 입출력 성능으로 대용량 데이터 트랜잭션을 위한 매우 진보적인 모델이다. 전통적인 데이터 저장소는 빠른 쓰기 연산을 위하여 한 레코드의 속성들을 하드 디스크에 연속적으로 배치되어 있는 가로-지향 저장 모델을 활용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템을 위해서는 월등한 판독 성능 때문에 컬럼-지향 저장소가 더 적합한 모델이 되고 있다. 또한 최근에는 플래시 메모리를 사용한 SSD가 고속 데이터 분석 시스템을 위한 적합한 저장 매체로 인식되고 있다. 본 연구에서는 플래시 미디어 파일 시스템을 기반으로 하는 컬럼-기반 데이터베이스 환경을 위한 새로운 트랜잭션 회복기법(CoSR)을 제안한다. 제안 기법은 기존의 쉐도우 페이징 기법을 개선하여 플래시 파일 시스템에서 새로운 블록에 데이터를 저장할 경우 무효화되어 폐기되는 이전 데이터 블록을 재활용하였다. 이를 위하여 제안된 컬럼-기반 쉐도우 복구 기법에 재활용 쉐도우 리스트 구조를 활용하였다. 제안 기법은 기존 쉐도우 페이징기법의 최대 단점인 쉐도우 페이지 관련 추가 저장공간의 부담을 최소화하고, 기존 복구 기법에서 컬럼 데이터 압축에 기인한 입출력 성능저하를 최소화 할 수 있다. 실험 분석결과를 통하여 CoSR기법이 기존 기법보다 17% 더 우수함을 확인하였다.

Keywords

References

  1. S. Ahn, K. Kim. "A Join Technique to Improve the Performance of Star Schema Queries in Column-Oriented Databases", Journal of Korean Institute of Information Scientist and Engineers, Vol. 40, No.3, pp. 209-218, 2013.6.
  2. S. Byun, Column-aware Transaction Management Scheme for Column-Oriented Databases, Journal of the Korean Society Internet Information, Vol. 15, No. 4 pp. 49-56, 2014 DOI: http://dx.doi.org/10.7472/jksii.2014.15.4.125
  3. D. Abadi, A. Boncz, and S. Harizopoulos, "Column-oriented Database Systems", Proc. of the VLDB, Lyon, France, August 24-28 2009. DOI: http://dx.doi.org/10.14778/1687553.1687625
  4. S. Harizopoulos, V. Liang, D. J. Abadi, and S. Madden, "Performance tradeoffs in read-optimized databases", Proc. of VLDB, pp. 487-498, 2006.
  5. S. Byun. "Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index", Journal of the Korea Academia-Industrial, Vol. 14, No.1, pp. 393-401, 2013. DOI: http://dx.doi.org/10.5762/KAIS.2013.14.1.393
  6. Lucas Mearian, "Analysis: SSD performance -- is a slowdown inevitable?", Available From: http://www.computerworld.com/s/article/9132668/ Analysis_SSD_performance_is_a_slowdown_inevitable_? taxonomyId=19& pageNumber=3, (accessed July, 2014)
  7. D. Abadi, S. Madden, and M. Ferreira. "Integrating compression and execution in column-oriented database systems", Proc. of SIGMOD, pp. 671-682, 2006. DOI: http://dx.doi.org/10.1145/1142473.1142548
  8. Tamer Ozsu, and Patrick Valduriez, Principles of Distributed Database Systems, Springer New York, 2011.
  9. Vijay Kummar, Albert Burger, "Performance Measurement of Main Memory Database Recovery Algorithms Based on Update-in-Place and Shadow Approaches", IEEE Transactions on Knowledge and Data Engineering, 4(6), 1992, pp. 567-571. DOI: http://dx.doi.org/10.1109/69.180607
  10. Jack Kent, Hector Garcia-Molina, "Optimizing Shadow Recovery Algorithms", IEEE Transactions on Software Engineering, 14(2), Feb. 1988, pp. 155-168. DOI: http://dx.doi.org/10.1109/32.4635
  11. J. Kim, S.Joo, H. Kang, An Efficient Recovery System for Spatial Main Memory DBMS, Journal of the Korea Spatial Information Society, Vol 8 No. 03, pp. 1-14, 2006.12
  12. E. M. Song, Y. K., Kim and C. H., Ryu "No-Log Recovery Mechanism Using Stable Memory for Real-Time Main Memory Database Systems", RTCSA'99, IEEE CS, Dec 1999, pp. 428-431.
  13. Chang L. and Kuo T., "An Adaptive Striping Architecture for Flash Memory Storage Systems of Embedded Systems", in:Proc. 8th IEEE Real-Time and Embedded Technology Symposium, California, San Jose, 2002, pp. 187-196. DOI: http://dx.doi.org/10.1109/RTTAS.2002.1137393
  14. Mendel Rosenblum John K. Ousterhout, "The design and implementation of a log-structured file system", ACM Transactions on Computer Systems, 10(1), February 1992, pp. 26-52. DOI: http://dx.doi.org/10.1145/146941.146943
  15. JFFS,Available From: http://developer.axis.com/software/ jffs/, (accessed Oct., 2014)
  16. Mesquite, CSIM2.0 Development Toolkit for Simulation and Modeling, Available From: http://www.Mesquite. com/documentation/documents/CSIM20_User_Guide- C.pdf, (accessed Dec., 10, 2014)