A Study on the Development of Learning Environment for Ship Navigation Agents

선박항해 에이전트 학습을 위한 보상설계 방안에 관한 연구

  • Park, Sekil (Korea Research Institute of Ships & Ocean Engineering (KRISO)) ;
  • Oh, Jaeyong (Korea Research Institute of Ships & Ocean Engineering (KRISO))
  • Published : 2020.11.11

Abstract

본 논문은 선박항해 에이전트가 개발 의도와 부합되도록 학습시키는데 있어 가장 중요한 역할을 수행하는 보상설계에 대해 소개한다. 보상설계는 먼저 학습 대상이 무엇인지 명확히 정의하는 것이 중요하며, 보상이 상황에 따라 다른 목적으로 활용되지 않도록 하고 에이전트에게 너무 드물게 주어지지 않도록 보상 형태화를 적용하는 등의 방법을 사용할 필요가 있다. 또한 보상을 구성하는 요소가 많아지는 경우에는 의도가 명확하게 전달이 되지 않을 수 있으므로 문제를 작은 문제들로 나누어 접근하는 계층적 강화학습 방법 등을 적용할 필요가 있다.

Keywords