DOI QR코드

DOI QR Code

Efficient Query Indexing for Short Interval Query

짧은 구간을 갖는 범위 질의의 효율적인 질의 색인 기법

  • 김재인 (전남대학교 전자컴퓨터공학부) ;
  • 송명진 (전남대학교 전자컴퓨터공학부) ;
  • 한대영 (전남대학교 전자컴퓨터공학부) ;
  • 김대인 (전남대학교 전자컴퓨터공학부) ;
  • 황부현 (전남대학교 전자컴퓨터공학부)
  • Published : 2009.08.31

Abstract

In stream data processing system, generally the interval queries are in advance registered in the system. When a data is input to the system continuously, for realtime processing, a query indexing method is used to quickly search queries. Thus, a main memory-based query index with a small storage cost and a fast search time is needed for searching queries. In this paper, we propose a LVC-based(Limited Virtual Construct-based) query index method using a hashing to meet the both needs. In LVC-based query index, we divide the range of a stream into limited virtual construct, or LVC. We map each interval query to its corresponding LVC and the query ID is stored on each LVC. We have compared with the CEI-based query indexing method through the simulation experiment. When the range of values of input stream is broad and there are many short interval queries, the LVC-based indexing method have shown the performance enhancement for the storage cost and search time.

데이터 스트림 환경에서는 지속적으로 입력되는 데이터에 대한 실시간 처리를 수행하기 위하여 범위를 갖는 다수의 질의를 시스템에 미리 등록한다. 등록된 질의를 입력 스트림에 따라 빠르게 검색하기 위해 질의 색인 기법을 사용하는데, 질의 색인은 메인 메모리 기반에서 동작하기 위해 색인 정보의 저장 비용이 낮아야 하고 빠른 질의 탐색을 실시해야 한다. 본 논문에서는 다수의 범위 질의에 대하여 색인 정보의 저장 비용이 낮고 빠른 질의 탐색을 실시하는 질의 색인 기법으로 LVC-based(Limited Virtual Construct-based) 기법을 제안한다. 해시기반으로 동작하는 LVC-based 색인 기법은 입력 스트림의 범위를 가상의 분할 구조로 나눈 LVC를 이용한다. 각 LVC는 식별자가 할당되고 각 LVC에 구간에 해당하는 범위 질의를 저장하며 색인을 실시한다. LVC-based 기법은 입력 스트림의 범위가 길고 범위가 짧은 다수의 질의를 색인할 때 저장비용과 탐색 비용에서 좋은 효율을 보이며 이는 기 제안된 CEI-based 색인 기법과의 비교를 통하여 입증하였다.

Keywords

References

  1. D.Carney, U. Cetintemel, M. Cherniack, C. Convey, S. Lee, G. Seidman, M. Stonebraker, N. Tatbul and S. Zdonik, 'Monitoring stream - a new class of data management applications', In Proc. of Very Lage Data Bases, 2002
  2. B. Babcock, S. Babu, M. Datar, R. Motwani, and J. Widom, 'Models and Issues in Data Stream systems', Proc. of ACM PODS 2002, Madison, Wisconsin, United States, 2002 https://doi.org/10.1145/543613.543615
  3. H. Edelsbrunner. 'Dynamic data structures for othogonal intersection queries', Technical Report 59, institute for Information Processing, Technical University of Graz, Graz, Austria, 1980
  4. E. Hanson, ISlist.tar: A tar file containing C++ source code for IS-lists, http://www-pub.cise.ufl.edu/~hanson/IS-lists/
  5. A. Guttman, 'R-trees: A dynamic index structure for spatial searching', ACM Computing Surveys, Vol.30, No.2, 1998.6
  6. E. Hanson, M, Chaabouni, C. Kim, and Y. Wang, 'A Predicate Matching Algorithm for Database Rule Systems', In Proc. of ACM SIGMOD 1990, 1990 https://doi.org/10.1145/93605.98736
  7. E. Hanson and T. Johnson, 'Selection Predicate Indexing for Active Database Using Interval Skip Lists', Information Systems, Vol.21, No.3, 1996 https://doi.org/10.1016/0306-4379(96)00015-4
  8. S. R. Madden, M. A. Shah, J. M. Hellerstein, and V. Raman. 'Continuously Adaptive Continuous Queries over Streams', Proc. of ACM SIGMOD 2002, Madison, Wisconsin, United States, 2002 https://doi.org/10.1145/564691.564698
  9. H. Samet, Design and Analysis of Spatial Data Structures, Addison-Wesley, 1990
  10. K.-L. Wu, S.-K. Chen, and P. S. Yu, 'Interval query indexing for efficient stream processing', In CIKM 2004, pp.88-97, 2004.11 https://doi.org/10.1145/1031171.1031188
  11. K.-L. Wu, S.-K. Chen, P. S. Yu and M. Mei. 'Efficient interval indexing for content-based subscription e-commerce and e-serviec', In Proc. of IEEE Int. Conf. on e-Commerce Technology for Dynamic E-Business, 2004.12 https://doi.org/10.1109/CEC-EAST.2004.38
  12. Motwani, R. et al., 'Query Processing, Approximation, and Resource Management in a Data Stream Management System', In Proc. The First Biennial Conf. on Innovative Data Systems Research, Asiloma, California, pp.245-256, 2003.1
  13. Terry, D. et al., 'Continuous Queries over Append-Only Databases', In Proc, Int'l Conf. on Management of Data, ACM SIGMOD, San Diego, California, pp.321-330, 1992.6 https://doi.org/10.1145/130283.130333