DOI QR코드

DOI QR Code

An Adaptive Materialized Query Selection Method in a Mediator System

미디에이터 시스템의 적응적 구체화 질의 선택방법

  • 주길홍 (연세대학교 대학원 컴퓨터학과) ;
  • 이원석 (연세대학교 컴퓨터학과)
  • Published : 2004.02.01

Abstract

Recent researches which purport to Integrate distributed information have been concentrated on developing efficient mediator systems that not only provide a high degree of autonomy for local users but also support the flexible integration of required functions for global users. However, there has been little attention on how to evaluate a global query in a mediator. A global query is transformed into a set of its sub-queries and each sub-query is the unit of evaluation in a remote server. Therefore, it is possible to speed up the execution of a global query if the previous results of frequently evaluated sub-queries are materialized in a mediator. Since the Integration schema of a mediator can be incrementally modified and the evaluation frequency of a global query can also be continuously varied, query usage should be carefully monitored to determine the optimized set of materialized sub-queries. Furthermore, as the number of sub-queries increases, the optimization process itself may take too long, so that the optimized set Identified by a long optimization process nay become obsolete due to the recent change of query usage. This paper proposes the adaptive selection of materialized sub-queries such that available storage in a mediator can be highly utilized at any time. In order to differentiate the recent usage of a query from the past, the accumulated usage frequency of a query decays as time goes by.

다양한 분산정보의 통합을 위하여 전역 사용자들이 요구하는 데이터들을 지역서버의 자치성을 유지하면서 효과적으로 제공하기 위한 미디 에이터 시스템의 연구가 활발하게 진행되고 있다. 그러나, 미디에이터에서의 전역질의를 효율적으로 처리하기 위한 방법의 연구는 상대적으로 매우 미흡한 실정이다. 미디에이터에서 전역질의는 원격지서버의 질의처리 단위인 부분질의의 집합으로 표현되어진다. 따라서, 미디에이터가 부분질의의 결과를 구체화방법으로 관리한다면 관련된 질의의 결과를 사용자에게 신속하게 제공할 수 있다. 그러나, 미디에이터에서는 통합 스키마의 변경이 자유롭고, 사용자의 질의가 자주 변할 수 있기 때문에 최적의 구체화부분질의를 결정하기 위해서 전역질의의 빈발정도를 지속적으로 파악해야 한다. 따라서, 부분질의의 수가 증가할수록 최적화의 수행시간이 매우 길어지기 때문에 부분질의 빈도의 최근의 변화를 적절하게 반영하지 못한다. 따라서 본 논문에서는 미디에이터 시스템의 저장공간의 활용율을 극대화하는 최적의 구체화부분질의 군을 선택하는 방법을 제안한다. 또한 과거와 최근의 부분질의의 활용형태가 다양하게 변할 수 있으므로 시간에 따른 감쇄율을 활용빈도에 적용하여 최근의 활용빈도의 변화에 민감하게 반응하고 활용형태의 변화에 따라 적응적으로 새로운 구체화부분질의 군을 선택할 수 있는 방법을 제안한다.

Keywords

References

  1. Sophie Cluet, Claude Delobel, Jerome Simeon, Katarzyna Smaga, 'Your Mediators Need Data Conversion!,' ACM SIGMOD'98 Seattle, WA, USA, 1998 https://doi.org/10.1145/276304.276321
  2. Mary Tork Roth, Peter Schwarz, 'Don't Scrap It, Wrap It! A Wrapper Architecture for Legacy Data Source,' Proceedings of the 23rd VLDB Conference Athens, Greece, 1997
  3. A.Leinwand, K.F.Conroy, 'Network Management,' Addison-Wesley Publishing, Inc., pp.17-36, 1996
  4. Nita Goyal et al., 'Preliminary Report on (Active) View, Materialization in GUI Programming,' proceedings of the Workshop on Materialization Views : Techniques and Applications, pp.56-64, June, 1996
  5. Anthony Tomasic, Louiqa Raschid, Patric Valduriez, 'Scaling Access to Heterogeneous Data Source with DISCO,' IEEE Transactions on Knowledge and Data Engineering, Vol.10, No.5, September/October, 1998 https://doi.org/10.1109/69.729736
  6. Chen Li, Ramana Yerneni, Vasilis Vassalos, Hector Garcia-Molina, Yannis Papakonstantinou, Jeffrey Ullman, Murty Valiveti, 'Capability Based Mediation in TSIMMIS,' ACM SIGMOD '98 Demo, Seattle, June, 1998 https://doi.org/10.1145/276304.276382
  7. V.S.Subrahmanian, Sibel Adali, Anne Brink, Ross Emery, James J. Lu, Adil Rajput, Timothy J. Rogers, Robert Ross, Charles Ward, 'HERMES : A Heterogeneous Reasoning and Mediator System,' http://www.cs.umd.edu/projects/hermes/overview/paper
  8. Anthony Tomasic, Remy Amouroux, Philippe Bonnet, Olga Kapitskaia, Hubert Naacke, Louiqa Raschid,'The Distributed Information Search Component (DISCO) and the World Wide Web,' ACM SIDMOD'97, AZ, USA https://doi.org/10.1145/253260.253402
  9. H.Gupta, 'Selection of view to materialized in a data warehouses,' ICDT, 1997
  10. J.Yang, K.Karlapalem, Q.Li, 'Algorithms for materialized view design in data warehousing environment,' VLDB'97, pp.136-145
  11. A.Y.Levy, A.Rajaraman and J.J.Ordille, 'Querying Heterogeneous Information Source Using Source Description,' VLDB, pp.251-262, 1996
  12. S.Chaudhuri, Krishnamurthy, S.Potamianos, K.shim, 'Optimizing Queries with Materialized Views,' ICDE, pp.190-200, 1995 https://doi.org/10.1109/ICDE.1995.380392
  13. Ashish Gupta, Inderpal Singh Mumick, 'Maintenance of Materialized View : Problems, Techniques, and Applications,' Proc. od Intl Conf, on Data Engineering, pp. 86-93, 1990
  14. V.Harinarayan, A.Rajaraman and J.Ulman, 'Implementing data cubes efficiently,' ACM SIGMOD International Conference of Management of Data, Canada, June, 1996 https://doi.org/10.1145/233269.233333
  15. S.Agrawal, R.Agrawal, P.M.Deshpande, A.Gupta, J.F.Naughton, R.Ramakrishnan, S.Sarawagi, 'On the Computation of Multidimensional Aggregates,' VLDB, pp.506-512, 1996
  16. Chuan Zhang, Xin Yao, Jian Yang, 'An Evolution Approach the materialized view selection in a data waregouse environment,' IEEE Trans. On systems, man and cybernetics, Vol.31, No.3, Setp., 2001
  17. A.Y.Levy, A.O.Mendelzon, Y.Sagiv and D.Srivastava, 'Answering Queries Using Views,' ACM SIGMOD, pp.95-104, 1995
  18. H.Gupta and I.S.Mumick, 'Selection of views to materialize under a maintenance cost constraint,' International Conference on Database Theory (ICDT), pp.453-470, 1999
  19. Alexandros Labrinidis, Nick Roussopoulos, 'On the Materialization of WebViews,' ACM SIGMOD Workshop on The Web and Databases (WebDB'99), Philadelphia, Pennsylvania, June, 1999
  20. Elena Baralis, Stefano Paraboschi, Ernest Teniente, 'Materialization View Selection in a Multidimesional Database,' Proceedings of the 23rd VLDB Conference Athens, Greece, 1997
  21. Horold S. Javitz, Alfonso Valdes, 'The NIDES Statistical Component : Description and Justification,' SRI International Menlo Park, California 94025, March, 1994
  22. 주길홍, 이원석, '미디에이터 시스템에서의 이질 분산데이터베이스의 통합을 위한 효율적인 뷰 관리 방법', 정보과학회논문지, Vol.28, No.4, December, 2001