Machine Learning based Personal Information Classification System in Large Image Files

머신러닝 기반의 대규모 이미지 파일에서 개인 정보 분류 시스템

  • Kim, Ki-Tae (Dept. of Computer System, INHA TECHNICAL COLLEGE) ;
  • Yun, Sang-Hyeok (Dept. of Computer System, INHA TECHNICAL COLLEGE) ;
  • Seo, Bo-in (Dept. of Computer System, INHA TECHNICAL COLLEGE) ;
  • Lee, Sei-hoon (Dept. of Computer System, INHA TECHNICAL COLLEGE)
  • 김기태 (인하공업전문대학 컴퓨터시스템과) ;
  • 윤상혁 (인하공업전문대학 컴퓨터시스템과) ;
  • 서보인 (인하공업전문대학 컴퓨터시스템과) ;
  • 이세훈 (인하공업전문대학 컴퓨터시스템과)
  • Published : 2020.07.15

Abstract

본 논문에서는 현재 이슈가 되고 있는 개인 정보 보안에 대해서 Keras 라이브러리를 사용하여 개인 정보 관련 데이터를 학습한 후, 한글 인식률 증가된 Tesseract-OCR 활용하여 사람들이 가지고 있는 데이터의 개인 정보 유무를 판단하여 분류한다.

Keywords