DOI QR코드

DOI QR Code

파일유사도 정보를 이용한 고정 분할 기반 중복 제거 기법

Efficient Deduplication Scheme on Fixed-length Chunking System Using File Similarity Information

  • 문영찬 (한림대학교 컴퓨터공학과) ;
  • 정호민 (한림대학교 컴퓨터공학과) ;
  • 고영웅 (한림대학교 컴퓨터공학과)
  • 발행 : 2012.04.26

초록

기존의 고정 길이 분할 (FLC: Fixed Length Chunking) 중복 제거 기법은 파일이 조금이라도 수정이 되면 수정된 블록에 대한 해시 정보가 달라져 중복 데이터 임에도 불구하고 중복 블록으로 검색이 되지 않는 문제점이 있다. 본 연구에서는 FLC 기반의 중복 제거 기법에 데이터 위치(offset) 정보를 활용하여 중복 블록을 효율적으로 찾아냄으로써 기존의 FLC 기반의 중복 제거 기법보다 더 좋은 성능을 발휘하는 유사도 정보를 활용하는 중복 제거 기법(FS_FLC: File Similarity based Fixed Length Chunking)을 설계하고 구현했다. 실험 결과 제안한 알고리즘은 낮은 오버헤드로 가변 분할 기법(VLC: Variable Length Chunking)만큼의 높은 중복 데이터 탐색 성능을 보여주었다.

키워드