DOI QR코드

DOI QR Code

Design and Implementation of High-dimensional Index Structure for the support of Concurrency Control

필터링에 기반한 고차원 색인구조의 동시성 제어기법의 설계 및 구현

  • 이용주 (한국전자통신연구원 컴퓨터시스템연구부) ;
  • 장재우 (전북대학교 전자정보공학부(컴퓨터공학과)) ;
  • 김학영 (한국전자통신연구원 컴퓨터시스템연구부) ;
  • 김명준 (한국전자통신연구원 컴퓨터소프트웨어 연구소)
  • Published : 2003.02.01

Abstract

Recently, there have been many indexing schemes for multimedia data such as image, video data. But recent database applications, for example data mining and multimedia database, are required to support multi-user environment. In order for indexing schemes to be useful in multi-user environment, a concurrency control algorithm is required to handle it. So we propose a concurrency control algorithm that can be applied to CBF (cell-based filtering method), which uses the signature of the cell for alleviating the dimensional curse problem. In addition, we extend the SHORE storage system of Wisconsin university in order to handle high-dimensional data. This extended SHORE storage system provides conventional storage manager functions, guarantees the integrity of high-dimensional data and is flexible to the large scale of feature vectors for preventing the usage of large main memory. Finally, we implement the web-based image retrieval system by using the extended SHORE storage system. The key feature of this system is platform-independent access to the high-dimensional data as well as functionality of efficient content-based queries. Lastly. We evaluate an average response time of point query, range query and k-nearest query in terms of the number of threads.

최근 이미지, 비디오와 같은 멀티미디어 데이터에 대한 효율적인 검색을 위해 많은 다차원 및 고차원 색인 구조들에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 색인 구조의 연구 방향은 검색의 효율을 극대화 하는데 초점을 맞추어 왔으며 최근의 멀티미디어 데이터베이스나 데이터 마이닝 분야와 같은 다수 사용자 환경을 요구하는 환경에서는 부적합한 실정이다. 이에 본 논문에서는 기존의 제시된 차원이 증가하면서 급속하게 성능이 저하되는 문제를 특징 벡터의 시그니쳐를 구성하여 완화시킨 필터링에 기반한 고차원 색인 구조에 동시성 제어기법을 설계 및 구현하여 위스콘신 대학에서 개발한 지속성 객체 저장 시스템인 SHORE 하부저장 시스템과 밀결합 방식으로 통합하였다. 확장된 SHORE 하부저장 시스템은 고차원 데이터에 대한 효율적인 검색 뿐만 아니라 레코드 레벨의 색인 데이터에 대한 동시성 제어를 지원하며 시그니쳐 파일을 모두 메모리에 로딩하는 구조를 개선하여 페이지 레벨의 관리가 가능하다. 아울러 본 논문에서 제시한 확장된 SHOE 하부저장 시스템을 실제 응용 시스템에 적용하기 위해 플랫폼 독립적인 환경을 지원하는 자바 언어를 사용하여 미들웨어 구축 방안을 제시한다. 또한 구축된 미들웨어를 통해 쓰레드 별로 대표적인 내용기반 질의 형태인 포인트질의, 범위질의, k-최근접 질의에 대한 다수 사용자 환경에서의 성능 평가를 수행하였다.

Keywords

References

  1. Berchtold S., Keim D., and Kriegel H.-P., 'The X-tree : An Index Structure for High-Dimensional Data,' 22nd Conf. on Very Large Databases, pp.28-39, 1996
  2. K. I. Lin, H. Jagadish, and C. Faloutsos, 'The TV-tree : An Index Structure for High Dimensional Data,' VLDB Journal, Vol.3, pp.517-542, 1994 https://doi.org/10.1007/BF01231606
  3. Beckmann N., Kriegel H. P, Schneider R., and Seeger B., 'The $R^*-tree$ : An Efficient and Robust Access Method for Points and Rectangles,' Proc. ACM SIGMOD Int. Conf. on Management of Data, pp.322-331, 1990 https://doi.org/10.1145/93597.98741
  4. Arya S., Mount D. M., and Narayan O., 'Accounting for Boundary Effects in Nearest Neighbor Searching,' Proc. 11th Annual Symp. on Computational Geometry, pp.336-344, 1995 https://doi.org/10.1145/220279.220315
  5. Berchtold S., Bohm C, Keim D., Kriegel H. P, 'A Cost Model fro Nearest Neighbor Search in High-Dimensional Data Space,' ACM PODS Symposium on Principles of Databases Systems, Tucson, Arizona, 1997
  6. 한성근, 이용주, 장재우, 김현진, '효율적인 고차원 데이터색인을 위한 셀-기반 필터링 기법', Proceedings of Korean Data base Conference, pp.26-35, 2000
  7. Sung-Geun Han and Jae Woo Chang, 'A New High-Dimen-sional Index Structure Using a Cell-Based Filtering Technique,' Proc. of International Conf. on ADBIS-DASFAA, pp.79-92, 2000
  8. Kwang Taek Song, Hwa-Jin Nam, and Jae-Woo Chang, 'A cell-based index structure for similarity search in high-dimensional feature spaces,' Proc. of ACM SAC, pp.264 268, 2001 https://doi.org/10.1145/372202.372338
  9. Carey, M., DeWitt, D., Naughton, J., Solomon, M., et. al, 'Shoring Up Persistent Applications,' Proc. of International Conf. on ACM SIGMOD, pp.383-394, 1994 https://doi.org/10.1145/191839.191915
  10. H-T Chou, et al, 'Design and Implementation of the Wis-consin Storage System,' Software Practice and Experience, Vol.15, No.10, 1985 https://doi.org/10.1002/spe.4380151003
  11. 정재욱, 장재우, '멀티미디어 응용을 위한 SHORE 하부저장 시스템의 확장', 한국정보과학회 가을학술발표논문집(1), pp. 6-8, 1999
  12. M. Kornacker, C. Mohan and J. M. Hellerstein, 'Concur-rency and Recovery in Generalized Search Trees,' Proc. of International Conf. on ACM SIGMOD, pp.62 72, 1997 https://doi.org/10.1145/253260.253272