DOI QR코드

DOI QR Code

Efficient Skyline Computation on Time-Interval Data Streams

유효시간 데이터 스트림에서의 스카이라인 질의 알고리즘

  • 박남훈 (안양대학교 컴퓨터학과) ;
  • 장중혁 (대구대학교 컴퓨터IT공학부)
  • Received : 2011.11.08
  • Accepted : 2012.01.05
  • Published : 2012.01.31

Abstract

Multi-criteria result extraction is crucial in many scientific applications that support real-time stream processing, such as habitat research and disaster monitoring. Skyline evaluation is computational intensive especially over continuous time-interval data streams where each object has its own customized expiration time. In this work, we propose TI-Sky - a continuous skyline evaluation framework. To ensure correctness, the result space needs to be continuously maintained as new objects arrive and older objects expire. TI-Sky strikes a perfect balance between the costs of continuously maintaining the result space and the costs of computing the final skyline result from this space whenever a pull-based user query is received. Our key principle is to incrementally maintain a partially precomputed skyline result space - however doing so efficiently by working at a higher level of abstraction. TI-Sky's algorithms for insertion, deletion, purging and result retrieval exploit both layers of granularity. Our experimental study demonstrates the superiority of TI-Sky over existing techniques to handle a wide variety of data sets.

다기준 의사결정 연구는 평가기준이 상이한 다수의 선호도로부터 최선의 대안을 찾는 방법으로 실시간 재난 탐지, 센서를 이용한 서식 모니터링 등의 응용환경에서 활용되어 왔다. 최근 유효시간 데이터 스트림 응용환경에서 각 객체들이 개개의 유효시간을 가지므로, 기존의 슬라이딩 윈도우보다 다기준 의사결정 방법, 즉 스카이라인 질의 수행에 더 많은 연산이 필요한다. 본 연구에서는 유효시간 데이터 스트림에서 스카이라인 질의를 수행하는 TI-Sky 알고리즘을 제시한다. 실시간 환경에서 새로운 객체가 생성되고 소멸되기까지 유효한 객체들을 관리하고 스카이라인 질의를 수행하기 위해 파티션단위의 시간 지배관계를 제시한다. 객체의 생성과 유효시간, 지배관계에 따라 시간지배관계를 갱신하며 다양한 방법으로 사멸객체를 제거하여 수행성능을 향상 시켰다. 실험을 통해 TI-Sky가 다양한 데이터 상에서 기존 연구보다 뛰어난 성능으로 스카이라인 질의를 수행하는 것을 증명하였다.

Keywords

References

  1. R. S. Barga, J. Goldstein, M. H. Ali, and M. Hong. "Consistent streaming through time: A vision for event stream processing", In CIDR, pages 363-374, 2007.
  2. S. Borzsonyi, D. Kossmann, and K. Stocker. "The skyline operator", In ICDE, pages 421-430, 2001.
  3. X. Lin, Y. Yuan,W.Wang, and H. Lu. "tabbing the sky: Efficient skyline computation over sliding windows", n ICDE, pages 502-513, 2005.
  4. M. Morse, J. Patel, and W. Grosky. "Efficient continuous skyline computation", Inf. Sci., pages 3411-3437, 2007.
  5. K. Mouratidis, S. Bakiras, and D. Papadias. "Continuous monitoring of top-k queries over sliding windows", In SIGMOD, pages 635-646, 2006.
  6. D. Papadias, Y. Tao, G. Fu, and B. Seeger. "An optimal and progressive algorithm for skyline queries", In SIGMOD, pages 467-478, 2003.
  7. U. Srivastava and J. Widom. "Flexible time management in data stream systems", In PODS, pages 263-274, 2004.
  8. Y. Tao and D. Papadias. "Maintaining sliding window skylines on data streams", TKDE (18:2), pages 377-391, 2006.
  9. Z. Zhang, R. Cheng, D. Papadias, and A. K. H. Tung. "Minimizing the communication cost for continuous skyline maintenance", In SIGMOD, pages 495-508, 2009.
  10. Shiming Zhang, N. Mamoulis, and D. W. Cheung. "Scalable skyline computation using object-based space partitioning", In Proc. SIGMOD, pp. 483-494, 2009.