SOM-Based $R^{*}-Tree$ for Similarity Retrieval

자기 조직화 맵 기반 유사 검색 시스템

  • 오창윤 (고창기능대학 정보통신설비과) ;
  • 임동주 (고창기능대학 정보통신설비과) ;
  • 오군석 (큐수대학 시스템정보과학 연구과) ;
  • 배상현 (조선대학교 전산통계학과)
  • Published : 2001.10.01

Abstract

Feature-based similarity has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects. the performance of conventional multidimensional data structures tends to deteriorate as the number of dimensions of feature vectors increase. The $R^{*}-Tree$ is the most successful variant of the R-Tree. In this paper, we propose a SOM-based $R^{*}-Tree$ as a new indexing method for high-dimensional feature vectors. The SOM-based $R^{*}-Tree$ combines SOM and $R^{*}-Tree$ to achieve search performance more scalable to high-dimensionalties. Self-Organizingf Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two-dimensional space. The map is called a topological feature map, and preserves the mutual relationships (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. We experimentally compare the retrieval time cost of a SOM-based $R^{*}-Tree$ with of an SOM and $R^{*}-Tree$ using color feature vectors extracted from 40,000 images. The results show that the SOM-based $R^{*}-Tree$ outperform both the SOM and $R^{*}-Tree$ due to reduction of the number of nodes to build $R^{*}-Tree$ and retrieval time cost.

특징 기반 유사성은 멀티미디어 데이터베이스 시스템에서 중요한 연구 쟁점이 되고 있다. 멀티미디어 데이터의 특징이 멀티미디어 객체들을 구별하는데 유용하다지만 특징 벡터의 차원의 수가 증가함에 따라 종래의 다차원 데이터 구조의 성능은 떨어지는 경향이 있다. $R^{*}-Tree$는 R-Tree의 가장 성공적인 병형으로 본 논문에서 고차원 특징 벡터를 위한 새로운 인덱싱 방법으로서 자기 조직화 맵 기반 $R^{*}-Tree$를 제안한다. 자기 조직화 맵 기잔 $R^{*}-Tree$는 고차원 데이터를 좀더 스칼라화해서 탐색할 수 있도록 SOM과 $R^{*}-Tree$를 결합하여 구축한 인덱싱 기법이다. 자기 조직 맵은 고차원 특징 벡터들로부터 2차원 공간으로의 맵핑을 제공한다. 그러나 맵을 위상 특징 맵이라 하고 인접 노느에서 서로 유사한 특징 벡터들을 모아서 입력데이터의 특징 공간들 속에 유사성을 보존하는데 위상 특징 맵의 각 노드는 코드북 벡터를 가지고 있다. 실험적으로 4만개의 이미지로부터 추출된 색깔 특징 벡터들을 이용하여 자기 조직화 맵 기반 $R^{*}-Tree$의 검색시간 비용과 자기 조직화 맵과 $R^{*}-Tree$의 검색 시간 비용을 비교한다. 그 결과 $R^{*}-Tree$를 구축하는데 필요한 노드 수와 검색 시간 비용이 감소됨으로써 자기 조직화 맵 기반 $R^{*}-Tree$는 자기 조직화 맵과 $R^{*}-Tree$보다 훨씬 우수한 성능을 나타냄이 입증되었다.

Keywords

References

  1. A. F. C. E. Jacobs and D. H. Salesin, 'Fast Multiresolution Image Querying,' In Proc. SIGGRAPH95, pp.6-11, Aug. 1995
  2. C. Faloutsos, W. Equitz, M. Flickner, W. Niblack, D. Petkovic, and R. Barber, 'Efficient and Effective Query by Image Content,' J. of Intell. Inform Syst., Vol.3, pp.231-262, 1994 https://doi.org/10.1007/BF00962238
  3. V. N. Gudivada and V. V. Raghavan, 'Content-based Image Retrieval system,' IEEE Computer, Vol.28, No.9, pp.18-22, Sep. 1995 https://doi.org/10.1109/2.410145
  4. A. Guttman, 'R-tree : a dynamic index structure for spatial searching,' In proc. of ACM SIGMOD Int. Conf. on Management of Data, pp.45-57. 1984 https://doi.org/10.1145/602259.602266
  5. N. Beckmann, H. Kriegel, R. Schneider, and B. Seeger, '$R^{\ast}$-tree : an efficient and robust access method for points and rectangles,' In Proc. of ACM SIGMOD Int. Conf. on Management of Data, pp.322-331, May. 1990 https://doi.org/10.1145/93597.98741
  6. S. Berchtold, C. Bohm, and H. P. Kriegal, 'The pyramidtechnique : towards breaking the curse of dimensionality,' In Proc. of ACM SIGMOD int. conf. on Management of data, pp.142-153, June 1998
  7. K. Chakrabarti and S. Mehrotra, 'High dimensional feature indexing using hybrid trees,' In Proc. of ICDE 1999, Mar. 1999
  8. T. Kohonen. 'Self-Organizing Maps,' Springer, Berlin, 1997
  9. T. Kohonen, 'Self-organizing maps,' Proc. of The IEEE, Vol.78, No.9, pp.1464-1480, 1990 https://doi.org/10.1109/5.58325
  10. M. Flickner, H. Sawhney, W. Niblack, J. Ashley, Q. Huang, B. Dom, M. Gorkani, j. Hafner, D. Lee, D. Petkovic, D. Steele, and P. Yanker, 'Query by Image and Video Content : The QBIC System,' IEEE Computer, Vol.28, No.9, pp.23-32, Sept. 1995 https://doi.org/10.1109/2.410146
  11. M. Koskelar. 'Content-Based Images Retrieval with Self-Organizing Maps,' Master's thesis, Helsinki Univ. of Technology, Dept. of Engineering Physics and Mathematics, 1999
  12. S. G. Mallat, 'Multifrequency Chnnel Decompositions of Images and Wavelet Models,' IEEE. Trans., Acoust., Speech and Signal Proc., Vol.37, No.12, pp.2091-2110, Dec. 1989 https://doi.org/10.1109/29.45554
  13. A. Natsev, R. Rastogi, and K. Shim. 'WALRUS : A Similarity Retrieval Algorithm for Image Databases,' In Proc. ACM SIGMOD International Conference on Management of Data, pp.396-400, Jun. 1999
  14. J. C. Russ, 'The Image Processing Handbook,' CRC Press, Boca Raton, 1995
  15. N. Roussopoulos, S. Kelley, and F. Vincent, 'Nearest neighbor queries,' In Proc. of the ACM SIGMOD, pp.71-79, May 1995 https://doi.org/10.1145/223784.223794