DOI QR코드

DOI QR Code

An Efficient Split Algorithm to Minimize the Overlap between Node Index Spaces in a Multi-dimensional Indexing Scheme M-tree

다차원 색인구조 M-트리에서 노드 색인 공간의 중첩을 최소화하기 위한 효율적인 분할 알고리즘

  • Published : 2005.04.01

Abstract

To enhance the user response time of content-based retrieval service for multimedia information, several multi-dimensional index schemes have been proposed. M-tree, a well-known multidimensional index scheme is of metric space access method, and is based on the distance between objects in the metric space. However, since the overlap between index spaces of nodes might enlarge the number of nodes of M-tree accessed for query processing, the user response time for content-based multimedia information retrieval grows longer. In this paper, we propose a node split algorithm which is able to reduce the sire of overlap between index spaces of nodes in M-tree. In the proposed scheme, we choose a virtual center point as the routing object and entry redistribution as the postprocessing after node split in order to reduce the radius of index space of a node, and finally in order to reduce the overlap between the index spaces of routing nodes. From the experimental results, we can see the proposed split algorithm reduce the overlap between index space of nodes and finally enhance the user response time for similarity-based query processing.

멀티미디어 데이터를 위한 내용기반 검색 서비스의 속도를 증진하기 위해 다차원 색인 기법에 대한 연구가 활발하게 진행되고 있다. 다차원 색인 기법의 하나인 M-트리는 노드의 중심점과 객체간의 상대적 거리를 이용하여 색인을 구성하고, 검색 공간에 포함되는 객체를 액세스하는 기법으로서 노드들은 페이지 단위로 구성되며 하위 엔트리들을 포함할 수 있는 반경, 즉 유사도 거리에 의해 노드의 영역이 표현되어진다. 그러나 이와 같은 노드의 영역 표현에 있어서 노드 색인 공간의 중첩으로 인해 질의 시 검색해야 하는 노드수가 증가하고 이는 거리계산과 디스크 입출력의 횟수를 증가시킨다. 본 논문에서는 M-트리에서 문제가 되고 있는 노드 색인 공간 중첩을 최소화하는 노드 분할 정책을 제안한다. M-트리의 기존 분할 정책들과는 다르게 노드의 가상 중심점을 계산하여 라우팅 객체로 이용하여 노드 색인 공간의 중첩을 최소화하고 노드 안의 엔트리 재분배를 통해 노드의 색인 공간의 크기를 작게 유지하며 밀도 높은 노드를 구성하도록 한다. 실험으로부터 제안된 노드 분한 알고리즘이 라우팅 노드의 색인 공간의 반경을 작게 유지하며 결과적으로는 사용자 질의에 대해 개선된 응답 시간을 제공하는 것으로 판명되었다.

Keywords

References

  1. C. Faloutsos, W. Equitz, M. Flickner, W. Niblack, D. Petkovic, and R. Barber, 'Efficient and Effective Querying by Image Content,' Journal of Intelligent Information System, 3(3/4), pp.231-262, 1994 https://doi.org/10.1007/BF00962238
  2. C. Faloutsos and K. I. Lin, 'FastMap: A Fast Algorithm for Indexing, Data-mining and Visualization of Traditional and Multimedia Databases,' Proc. of Int. Conf. on ACM SIGMOD, pp.163-174, 1995 https://doi.org/10.1145/223784.223812
  3. E. Wood, T. Blum, D. Keislar, and J. Wheaton, 'Content-based Classification, Search, and Retrieval of Audio,' IEEE Multimedia, 3(3), pp.27-36, 1996 https://doi.org/10.1109/93.556537
  4. R. Agrwal, C. Faloutsos, and A. Swami, 'Efficient Similarity Search in Sequence Databases,' Lecture Note in Computer Science, Springer-Verlag, Vol.730, pp.69-84, 1993 https://doi.org/10.1007/3-540-57301-1_5
  5. V. Gaedes and O. Gunther, 'Multidimensional Access Methods,' Technical Report TR-96-043, International Computer Science Institute, Berkely, CA, pp.36-59, 1996
  6. C. Traina Jr., A. Traina, C. Faloutsoss, and B. Seeger, 'Fast Indexing and Visualization of Metric Data Sets using Slim-Trees,' IEEE Transaction on Knowldege and Data Engineering, 14(2), pp.244-259, 2002 https://doi.org/10.1109/69.991715
  7. C. Traina Jr., A. Traina, B. Seegar, and C. Faloutsos, 'Slim-tree: High Performance Metric Trees Minimizing Overlap Between Nodes,' Proc. of Int. Conf. on Extending Database Technology(EDBT), pp.51-65, 2000
  8. N. Beckmann, H. P. Kriegel, R. Schneider, and B. Seeger, 'The R*-tree: An Efficient and Robust Access Method for Point and Rectangles,' Proc. of Int. Conf. on ACM SIGMOD, pp.322-331, 1990 https://doi.org/10.1145/93597.98741
  9. D. A. White and R. Jain, 'Similarity Indexing with the SS-tree,' Proc. 12th Int. Conf. on Data Engineering(ICDE), pp.516-523, 1996 https://doi.org/10.1109/ICDE.1996.492202
  10. N. G. Colossi and M.A Nascimento, 'Benchmarking Access Structure for High-Dimensional Multimedia Data', TR-9905, Univ. of Alberta, 1999
  11. N. Katayama and S. Satoh, 'The SR-tree: An Index Structure for High-Dimensional Nearest-Neighbor queries,' Proc. of Int. Conf. on ACM SIGMOD, pp.28-29, 1996
  12. S. Berchtold, D. A. Keim, and H. P. Kriegel, 'The X-tree: An Index Structure for High-Dimensional Data,' VLDB Journal, 3(4), pp.517-542, 1996 https://doi.org/10.1007/BF01231606
  13. J. K. Uhlmann, 'Satisfying General Proximity/Similarity Queries with Metric Trees,' Information Processing Letters, 40(1), pp.175-179, 1991 https://doi.org/10.1016/0020-0190(91)90074-R
  14. T. Bozkaya and M. Ozsoyoglu, 'Distance-Based Indexing for High-Dimensional Metric Spaces,' Proc. of Int. Conf. on ACM SIGMOD, pp.357-368, 1997 https://doi.org/10.1145/253260.253345
  15. P. Ciaccia, M. Patella, and P. Zezula, 'M-tree: An Efficient Access Method for Similarity Search in Metric spaces,' Proc. of Int. Conf. on Very Large Databases(VLDB), pp,426-435, 1997
  16. E. Chavez, G. Navarro, R. Baeza-Yates, and J. Marroquin, 'Searching in Metric Spaces,' ACM Computing Surveys, 33(3), pp.273-321, 2001 https://doi.org/10.1145/502807.502808
  17. J. Han, M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, pp.349-354, 2001
  18. J. M. Hellerstein, J. F. Naughton, and A. Pfeffer, 'Generalized Search Trees for Database Systems,' Proc. of Int. Conf. on Very Large Databases(VLDB), pp.562-573, 1995
  19. 박만수 ,박철의, 김희린, 강경옥, 'Pitch 히스토그램을 이용한 내용기반 음악 정보 검색, ' 한국방송공학회, 방송공학회논문지, 제9권, 1호, pp.2-8, 2004