Development of integrated data augmentation automation tools for deep learning

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발

  • Jang, Chan-Ho (Seoul National University of Science And Technology) ;
  • Lee, Seo-Young (Seoul National University of Science And Technology) ;
  • Park, Goo-Man (Seoul National University of Science And Technology)
  • 장찬호 (서울과학기술대학교 전자IT미디어공학과) ;
  • 이서영 (서울과학기술대학교 전자IT미디어공학과) ;
  • 박구만 (서울과학기술대학교 전자IT미디어공학과)
  • Published : 2021.11.26

Abstract

4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

Keywords