Data preprocessing for efficient machine learning

효율적인 기계학습을 위한 데이터 전처리

  • Kim, Dong-Hyun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Yoo, Seung-Eon (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Lee, Byung-Jun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Kim, Kyung-Tae (Dept. of Software, Sungkyunkwan University) ;
  • Youn, Hee-Yong (Dept. of Electrical and Computer Engineering, Sungkyunkwan University)
  • 김동현 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 유승언 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 이병준 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 김경태 (성균관대학교 소프트웨어대학 소프트웨어학과) ;
  • 윤희용 (성균관대학교 정보통신대학 전자전기컴퓨터공학과)
  • Published : 2019.01.16

Abstract

데이터를 기반으로 한 기계학습은 데이터의 양, 학습 모델, 그리고 데이터의 특징 등 다양한 환경에 민감한 특징을 지니고 있어, 보다 효율적인 기계학습을 위해 데이터의 전처리 과정을 필요로 한다. 데이터의 전처리 과정이란 특징 선택(Feature selection), 노이즈 데이터의 제거, 차원 감소(Demension reduction), 클러스터링(Clustering) 등 보다 효율적인 기계학습을 위한 방법이다. 따라서 본 논문에서는 다양한 환경에서 보다 효율적인 기계학습을 위한 데이터 전처리 기술의 종류 및 간단한 특징에 대해 서술한다.

Keywords