DOI QR코드

DOI QR Code

How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge

사전 지식에 의한 강화학습 에이전트의 학습 속도와 경향성 변화

  • Kim, Jisoo (Dept. of Computer Science and Engineering, Korea University) ;
  • Lee, Eun Hun (Dept. of Computer Science and Engineering, Korea University) ;
  • Kim, Hyeoncheol (Dept. of Computer Science and Engineering, Korea University)
  • Published : 2020.05.29

Abstract

학습 속도가 느린 강화학습을 범용적으로 활용할 수 있도록 연구가 활발하게 이루어지고 있다. 사전 지식을 제공해서 학습 속도를 높일 수 있지만, 잘못된 사전 지식을 제공했을 위험이 존재한다. 본 연구는 불확실하거나 잘못된 사전 지식이 학습에 어떤 영향을 미치는지 살펴본다. OpenAI Gym 라이브러리를 이용해서 만든 Gamble 환경, Cliff 환경, 그리고 Maze 환경에서 실험을 진행했다. 그 결과 사전 지식을 통해 에이전트의 행동에 경향성을 부여할 수 있다는 것을 확인했다. 또한, 경로탐색에 있어서 잘못된 사전 지식이 얼마나 학습을 방해하는지 알아보았다.

Keywords