주식 데이타베이스에서 질의간 따름 관계를 이용한 연속 질의의 처리

Continuous Query Processing Utilizing Follows Relationship between Queries in Stock Databases

  • 하유민 (연세대학교 컴퓨터과학과) ;
  • 김상욱 (한양대학교 정보통신학부) ;
  • 박상현 (연세대학교 컴퓨터과학과)
  • 발행 : 2006.11.15

초록

본 논문에서는 주식 데이타베이스로부터 탐사된 다수의 규칙들을 이용하여 주식 투자 추천을 요구하는 대량의 연속 질의들을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 본 논문에서는 주식투자 추천을 위한 사용자 질의의 특성을 분석함으로써 질의간에 존재하는 새로운 관계인 '따름 관계'를 정의한다. 두 질의 $Q_1,\;Q_2$간의 추천값 X에 대한 따름 관계는 '만일 선행 질의 $Q_1$의 추천값이 X이면, 추종 질의 $Q_2$의 추천값은 항상 X인 관계'를 의미한다. 이러한 따름 관계가 존재하는 경우, 추종 질의 $Q_2$의 추천값은 선행 질의 $Q_1$의 추천값을 이용하여 ,바로 결정할 수 있으므로 $Q_2$를 위한 질의 처리 과정을 제거할 수 있다. 본 논문에서는 전체 사용자 질의들간의 따름 관계들을 파악하여 그래프 형태로 표현하는 방법을 제안한다. 또한, 처리 과정이 제거되는 질의들의 수가 최대가 되도록 이러한 그래프를 탐색하여 질의 처리 순서를 결정하는 방법을 제안한다. 따름 관계를 기반으로 하는 제안된 방식을 이용하는 경우, 많은 사용자 질의들은 실제 질의 처리 과정이 불필요하게 되므로 전체 시스템의 처리 성능을 크게 개선할 수 있다. 실제 주가 데이타를 이용한 실험을 통하여 제안한 질의 처리 방식의 우수성을 규명한다. 실험 결과에 의하면, 제안된 방식에 의한 전체 질의 처리 시간은 기존 방식에 의한 시간의 10%이하로 줄어드는 것으로 나타났다.

This paper analyzes the properties of user query for stock investment recommendation, and defines the 'following relation', which is a new relation between two queries. A following relation between two queries $Q_1,\;Q_2$ and a recommendation value X means 'If the recommendation value of a preceding Query $Q_1$ is X, then a following query $Q_2$ always has X as its recommendation value'. If there exists a following relation between $Q_1\;and\;Q_2$, the recommendation value of $Q_2$ is decided immediately by that of $Q_1$, therefore we can eliminate the running process for $Q_2$. We suggest two methods in this paper. The former method analyzes all the following relations among user queries and represents them as a graph. The latter searches the graph and decides the order of queries to be processed, in order to make the number of eliminated query-running process maximized. When we apply the suggested procedures that use the following relation, most of user queries do not need to be processed directly, hence the performance of running overall queries is greatly improved. We examined the superiority of the suggested methods through experiments using real stock market data. According to the results of our experiments, overall query processing time has reduced less than 10% with our proposed methods, compared to the traditional procedure.

키워드

참고문헌

  1. R. Agrawal, C. Faloutsos, and A. Swami, 'Efficient Similarity Search in Sequence Databases,' In Proc. the 4th Int'l Conf.. on Foundations of Data Organization and Algorithms(FODO), Chicago, Illinois, pp. 69-84, Oct. 1993 https://doi.org/10.1007/3-540-57301-1_5
  2. S. W. Kim, S. H. Park, and W. W. Chu, 'An Index-Based Approach for Similarity Search Supporting Time Warping in Large Sequence Databases,' In Proc. Int'l. Conf. on Data Engineering, IEEE, pp. 607-614, 2001 https://doi.org/10.1109/ICDE.2001.914875
  3. W. K. Loh, S. W. Kim, and K. Y. Whang, 'A Subsequence Matching Algorithm that Supports Normalization Transform in Time-Series Databases,' Data Mining and Knowledge Discovery Journal, Vol. 9, No. 1, pp. 5-28, July. 2004 https://doi.org/10.1023/B:DAMI.0000026902.89522.a3
  4. S. H. Park et al., 'Efficient Searches for Similar Subsequences of Difference Lengths in Sequence Databases,' In Proc. Int'l. Conf. on Data Engineering, IEEE ICDE, pp. 23-32, 2000 https://doi.org/10.1109/ICDE.2000.839384
  5. P. Bloomfield, Fourier Analysis of Time Series, Wiley, 2000
  6. R. Agrawal et al., 'Fast Similarity Search in the Presence of Noise, Scaling, and Translation in Time-Series Databases,' In Proc. Int'I, Conf.' on Very Large Data Bases, VLDB, pp. 490-501, Sept. 1995
  7. C. Faloutsos, M. Ranganathan, and Y. Manolopoulos, 'Fast Subsequence Matching in TimeSeries Databases,' In Proc. Int'l. Conf. on Management of Data, ACM SIGMOD, pp. 419-429, May 1994 https://doi.org/10.1145/191839.191925
  8. T. Anderson, The Statistical Analysis of Time Series, Wiley, 1971
  9. T. Hellstrom and K. Holmstrom, Predicting the Stock Market, Opuscula ISRN HEV-BIB-OP26-SE, Aug. 1998
  10. Authors removed, 'Rule Discovery and Matching in Stock Databases,' submitted for publication, 2006
  11. S. Babu and J. Widom, 'Continuous Queries over Data Streams,' ACM SIGMOD Record Vol. 30, No.3, pp. 109-120, 2001 https://doi.org/10.1145/603867.603884
  12. R. Agrawal and R. Srikant, 'Fast Algorithms for Mining Association Rules,' In Proc. Int'l. Conf. on Very Large Data Bases, VLDB, pp. 487-499, 1994
  13. R. Agrawal and R. Srikant, 'Mining Sequential Patterns,' In Proc. Int'l Conf. on Data Engineering, IEEE ICDE, pp. 3-14, 1995
  14. Koscom Data Mall, http://datamall.koscom.co.kr, 2005
  15. G. Manku and R. Motwani, 'Approximate Frequency Counts over Data Streams,' In Proc. Int'l, Conf. on Very Large Data Bases, VLDB, pp. 346-357, Aug. 2002