A Study on Machine Learning and Basic Algorithms

기계학습 및 기본 알고리즘 연구

  • Kim, Dong-Hyun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Lee, Tae-ho (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Lee, Byung-Jun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Kim, Kyung-Tae (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
  • Youn, Hee-Yong (Dept. of Software, Sungkyunkwan University)
  • 김동현 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 이태호 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 이병준 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 김경태 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
  • 윤희용 (성균관대학교 소프트웨어대학 소프트웨어학과)
  • Published : 2018.07.13

Abstract

본 논문에서는 기계학습 및 기계학습 기법 중에서도 Markov Decision Process (MDP)를 기반으로 하는 강화학습에 대해 알아보고자 한다. 강화학습은 기계학습의 일종으로 주어진 환경 안에서 의사결정자(Agent)는 현재의 상태를 인식하고 가능한 행동 집합 중에서 보상을 극대화할 수 있는 행동을 선택하는 방법이다. 일반적인 기계학습과는 달리 강화학습은 학습에 필요한 사전 지식을 요구하지 않기 때문에 불명확한 환경 속에서도 반복 학습이 가능하다. 본 연구에서는 일반적인 강화학습 및 강화학습 중에서 가장 많이 사용되고 있는 Q-learning 에 대해 간략히 설명한다.

Acknowledgement

Grant : 초연결 IoT 노드의 군집 지능화를 통한 Edge Computing 핵심 기술 연구, 실시간 공공안전 서비스를 위한 소프트웨어 정의 무선 센서 네트워크 핵심기술 연구, 실시간 스트림 데이터 처리 및 Multi-connectivity를 지원하는 SDN 기반 WSN 핵심 기술 연구

Supported by : 정보통신기술진흥센터, 한국연구재단, 삼성전자