DOI QR코드

DOI QR Code

Design and Performance Analysis of MapReduce-based kNN join Query Processing Algorithm

맵리듀스 기반 kNN join 질의처리 알고리즘의 설계 및 성능평가

  • Kim, TaeHoon (Dept of Computer Science, Jeonbuk National University) ;
  • Lee, HyunJo (Dept of Computer Science, Jeonbuk National University) ;
  • Chang, JaeWoo (Dept of Computer Science, Jeonbuk National University)
  • 김태훈 (전북대학교 컴퓨터공학과) ;
  • 이현조 (전북대학교 컴퓨터공학과) ;
  • 장재우 (전북대학교 컴퓨터공학과)
  • Published : 2014.11.05

Abstract

최근 대용량 데이터에 대한 효율적인 데이터 분석 기법이 활발히 연구되고 있다. 대표적인 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의를 처리하기 때문에 질의처리 시간을 감소시킨다. 그러나 VkNN-join은 색인 구축 비용이 높으며, kNN 연산 오버헤드가 큰 문제점이 존재한다. 이를 해결하기 위해, 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 감소시킨다. 또한 시드 간 평균 거리를 기반으로 후보 영역을 선정함으로써, 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 나타낸다.

Keywords