DOI QR코드

DOI QR Code

스트림 환경에서 높은 균일신뢰도를 지원하는 가변 크기 샘플링

Variable Size Sampling to Support Uniformity Confidence in Stream Environments

  • 김하진 (강원대학교 컴퓨터과학과) ;
  • 이상훈 (강원대학교 컴퓨터과학과) ;
  • 길명선 (강원대학교 컴퓨터과학과) ;
  • 문양세 (강원대학교 컴퓨터과학과)
  • Kim, Hajin (Dept. of Computer Science, Kangwon National University) ;
  • Lee, Sanghun (Dept. of Computer Science, Kangwon National University) ;
  • Gil, Myeong-Seon (Dept. of Computer Science, Kangwon National University) ;
  • Moon, Yang-Sae (Dept. of Computer Science, Kangwon National University)
  • 발행 : 2017.11.01

초록

본 논문에서는 스트림 환경에서의 샘플링 기법 중 랜덤 샘플링과 유사한 특성을 갖는 KSample의 균일신뢰도 향상에 초점을 맞춘다. 이를 위해, 먼저 KSample의 균일신뢰도 문제점을 분석하여 KSample의 균일신뢰도가 초기에 많이 감소하는 현상을 초기 균일신뢰도 저하 문제로, KSample의 균일신뢰도가 지속적으로 감소하는 현상을 지속 균일신뢰도 저하 문제라 정의한다. 그리고 초기 균일신뢰도 저하 문제를 발생시키는 성질을 과거 샘플 불변으로, 지속 균일신뢰도 저하 문제를 발생시키는 성질을 샘플 추출 범위 증가로 정의하고 이를 해결하여 균일신뢰도를 향상시킨 UC KSample을 제안한다. 실험 결과, 샘플링 비율 p=0.01, 균일신뢰도 하한 ${\varepsilon}=0.7$일 때, UC KSample의 균일신뢰도가 기존 KSample 보다 약 2.2배 증가하였고, 균일신뢰도는 항상 하한 이상으로 유지되었다. 본 연구는 스트림 환경에서 중요한 척도인 균일신뢰도를 KSample에 결합시킨 최초의 시도로서, 샘플링 비율을 유지하며 동적으로 샘플링하는 KSample의 장점은 유지하면서도 균일신뢰도를 증가시킨 우수한 연구라 사료된다.

키워드

과제정보

연구 과제번호 : 데이터 스트림 정제를 위한 지능형 샘플링 및 필터링 기술 개발, 국제표준 기반 오픈 데이터 유통 플랫폼 확장 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터