How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge

Kim, Jisoo;Lee, Eun Hun;Kim, Hyeoncheol;

doi:10.3745/PKIPS.y2020m05a.512

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2020.05a
/
Pages.512-515
/
2020
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge

사전 지식에 의한 강화학습 에이전트의 학습 속도와 경향성 변화

Kim, Jisoo (Dept. of Computer Science and Engineering, Korea University) ;
Lee, Eun Hun (Dept. of Computer Science and Engineering, Korea University) ;
Kim, Hyeoncheol (Dept. of Computer Science and Engineering, Korea University)

김지수 (고려대학교 컴퓨터학과) ;
이은헌 (고려대학교 컴퓨터학과) ;
김현철 (고려대학교 컴퓨터학과)

Published : 2020.05.29

https://doi.org/10.3745/PKIPS.y2020m05a.512 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

학습 속도가 느린 강화학습을 범용적으로 활용할 수 있도록 연구가 활발하게 이루어지고 있다. 사전 지식을 제공해서 학습 속도를 높일 수 있지만, 잘못된 사전 지식을 제공했을 위험이 존재한다. 본 연구는 불확실하거나 잘못된 사전 지식이 학습에 어떤 영향을 미치는지 살펴본다. OpenAI Gym 라이브러리를 이용해서 만든 Gamble 환경, Cliff 환경, 그리고 Maze 환경에서 실험을 진행했다. 그 결과 사전 지식을 통해 에이전트의 행동에 경향성을 부여할 수 있다는 것을 확인했다. 또한, 경로탐색에 있어서 잘못된 사전 지식이 얼마나 학습을 방해하는지 알아보았다.

Keywords

Q-learning

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge

사전 지식에 의한 강화학습 에이전트의 학습 속도와 경향성 변화

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)