Selectivity Estimation for Multidimensional Sequence Data in Spatio-Temporal Databases

시공간 데이타베이스에서 다차원 시퀀스 데이타의 선택도추정

  • 신병철 (에어포인트(주) 기술연구소) ;
  • 이종연 (충북대학교 컴퓨터교육과)
  • Published : 2007.02.15

Abstract

Selectivity estimation techniques in query optimization have been used in commercial databases and histograms are popularly used for the selectivity estimation. Recently, the techniques for spatio-temporal databases have been restricted to existing temporal and spatial databases. In addition, the selectivity estimation techniques focused on time-series data such as moving objects. It is also impossible to estimate selectivity for range queries with a time interval. Therefore, we construct two histograms, CMH (current multidimensional histogram) and PMH (past multidimensional histogram), to estimate the selectivity of multidimensional sequence data in spatio-temporal databases and propose effective selectivity estimation methods using the histograms. Furthermore, we solve a problem about the range query using our proposed histograms. We evaluated the effectiveness of histograms for range queries with a time interval through various experimental results.

선택도 추정 기법은 질의 최적화를 위해 현재 상용 데이터 베이스에서 많이 사용되고 있고 히스토그램은 가장 많이 사용되는 선택도 추정 기법중의 하나이다. 최근에 시공간 데이터 베이스 관련 연구들에서 이러한 선택도 추정 기법이 기존의 시간 공간 데이타베이스 선택도 추정 기법을 확장하여 활발하게 연구되었다. 하지만 기존의 시공간 데이타베이스 선택도 추정 연구는 주로 이동 객체와 같은 시계열 데이타만 고려하였다. 또한 기존의 연구는 과거시점부터 현재 시점까지 시간적 범위 질의에 대한 선택도 추정은 불가능하였다. 따라서 본 논문에서는 시공간 데이타베이스에서 과거 시점에서 현재시점까지 시퀀스 데이타의 시간적 범위 질의를 위한 히스토그램을 구축하고 이를 이용한 효과적인 선택도 추정 기법을 제안한다. 제안한 히스토그램을 이용하면 과거부터 현재까지 시퀀스 데이타의 선택도 추정이 가능하고, 범위시간 선택도 추정 기법이 가능하며 효과적인 히스토그램 유지 기법의 적용이 가능하다.

Keywords

References

  1. Acharya, S., Poosala, V., and Ramaswamy, S., 'Selectivity Estimation in Spatial Databases,' In ACM SIGMOD, USA, pages 13-24, 1999
  2. Aboulnaga, A. and Naughton, J. 'Accurate Estimation of the Cost of Spatial Selections,' In ICDE, pages 123-134, 2000
  3. Poosala V., Yannis E., Ioannidis, Peter J., Haas., and Eugene J. Shekita, 'Improved Histograms for Selectivity Estimation of Range Predicates,' In ACM SIGMOD, NY, USA, pages 294-305, 1996
  4. Yossi Matias, Jeffrey Scott Vitter, and Min Wang, 'Wavelet-Based Histogram for Selectivity Estimation,' In Proceedings of ACM SIGMOD international conferences on Management of data, pages 448-459, 1998
  5. J. S. Vitter, M. Wang, and B. Iyer, 'Data cube approximation and histograms via wavelets,' In Proceedings of Seventh International Conference on Information and Knowledge Management, pages 96-104, Washington D.C., November 1998
  6. K. Charkrabarti, M. Garofalakis, R. Rastogi, and K. Shim, 'Approximate Query Processing Using Wavelets,' In Proc. of the 26th Intl. Conf. on Very Large Data Bases, September 2000
  7. Wang, M., Vitter, J., S., Lim, L., and Pdmanabhan, S., 'Wavelet-Based Cost Estimation for Spatial Queries,' In The 7th International Sysposium on Spatial and Temporal Databases(SSTD), CA, USA, pages 175-196, July 2001
  8. Matias, J.S. Vitter, and M. Wang, 'Dynamic Maintenance of Wavelet-Based Histogram,' In Proc. of the 26th INtl. Conf. on Very Large Data Bases, September 2000
  9. M. Garofalakis and P.B. Gibbons, 'Wavelet Synopses with Error Guarantees,' Bell Labs Tech. Memorandum, December 2001
  10. Antonios Deligiannakis and Nick Roussopoulos, 'Extended Wavelets for Multiple Measures,' In Processdings of the 2003 ACM SIGMOD International Conference on Management of Data
  11. Choi, Y. and Chung, C., 'Selectivity Estimation for Spatio-Temporal Queries to Moving Objects,' In ACM SIGMOD, pages 440-451, 2002
  12. Tao, Y., Sun, J., and Papadias, D., 'Selectivity Estimation for Predictive Spatio-Temporal Queries,' ICDE, pages 417-428, 2003
  13. Hadjieleftheriou, M., Kollios, H., and Tsotras, V J., 'Performance Evaluation of Spatio-temporal Selectivity Estimation Techniques,' In The 15th Int. conference on Science and Statistical Database Management (SSDBM), pages 202-211, 2003
  14. Zhan, Q. and Lin, X., 'Clustering Moving Objects for Spatio-temporal Selectivity Estimation,' In ADC, pages 123-130, 2004
  15. Sun, J., Papadias, D., Tao, Y., and Liu, B,. 'Querying about the Past, the Present, and the Future in Spatio-Temporal Databases,' In ICDE, pages 202-213, Mar. 2004
  16. Tao, Y., Papadias, D., and Sun, J., 'The TPR*- tree: An Optimized Spatio- Temporal Access Method for Predictive Queries,' In Proceedings of the 29th Very Large Data Bases Conference, Berlin, Germany, pages 790-801, 2003
  17. Lee, J. and Shin, B., 'Histogram-based Selectiviry Estimation in Spatio-Temporal Databases,' In Jonual of Korea Information Processing Society, Vol. 12-D, No.1, Feb. 2005