Classification and Allocation method of e-mail using possibility distribution and prediction

확률 분포와 추론에 의한 이메일 분류 및 정리 방법

  • Go, Nam-Hyeon (Dept. of Computer Science, Korea Open National University) ;
  • Kim, Ji-Yun (Dept. of Computer Software, Hanyang University) ;
  • Choi, Man-Kyu (Graduate school of Logistics, Incheon National University)
  • 고남현 (한국방송통신대학교 컴퓨터과학과) ;
  • 김지윤 (한양대학교 컴퓨터소프트웨어학과) ;
  • 최만규 (인천대학교 동북아물류대학원)
  • Published : 2016.07.12

Abstract

본 논문에서는 디리클레 분포와 베이즈 추론 모델을 활용하여 전자우편을 분류하고 정리하는 방법을 제안한다. 과거 원치 않는 광고성 이메일인 스팸 탐지에서 시작한 전자우편 분류는 지속적인 송수신 량의 증가와 내용의 다양화로 인해 광고성과 정보성의 판단 기준이 모호해진 상태이다. 스팸 탐지와 같은 이분법적 분류 방식이 아닌 내용의 주제 별로 자동 분류할 수 있는 방법이 필요하다. 본 논문에서 다루는 제안 기법은 전자우편의 내용에서 다뤄질 수 있는 주제의 종류를 예측하기 위한 방법을 제공한다. 발신하거나 수신된 전자우편이 속한 주제를 자동으로 정할 수 있다. 본 제안 기법의 활용을 통해 전자우편의 분류만이 아닌 업무 및 시장 동향 분석과 정보보안 분야에서는 악성코드 분류에 사용될 수 있을 것으로 기대된다.

Keywords