A Study on Smoker Prediction Using Machine Learning Algorithm

기계학습 알고리즘을 이용한 흡연자 예측 연구

  • Jongwoo Baek (Dept. of Computer Science and Engineering, Kangwon National University) ;
  • Joonil Bang (Dept. of Computer and Communications Engineering, Kangwon National University) ;
  • Joowon Lee (Dept. of Computer and Communications Engineering, Kangwon National University) ;
  • Hwajong Kim (Dept. of Computer Science and Engineering, Kangwon National University)
  • 백종우 (강원대학교 컴퓨터공학과) ;
  • 방준일 (강원대학교 IT 대학 컴퓨터정보통신학과) ;
  • 이주원 (강원대학교 IT 대학 컴퓨터정보통신학과) ;
  • 김화종 (강원대학교 컴퓨터공학과)
  • Published : 2023.07.12

Abstract

본 논문에서는 사람에게서 나타나는 생체 특성과 흡연여부의 상관관계 분석을 위해 랜덤 포레스트와 그래디언트 부스팅 트리의 두 가지 기계학습 알고리즘을 사용하였다. 연구에 사용된 데이터는 국민건강보험공단에서 제공하고 Kaggle에서 취합하여 정리한 건강검진 정보를 사용하였다. 분류 모델의 학습에 있어 혈청 정보가 높은 관계성을 보일 것으로 예상하였으나, 실제 결과는 성별이 가장 큰 영향을 끼치는 것으로 확인되었다.

Keywords

Acknowledgement

본 과제(결과물)는 2023년도 교육부의 재원으로 한국연구재단의 지원을 받아 수행된 지자체-대학 협력기반 지역혁신 사업의 결과입니다. (2022RIS-005)