Continual Multiagent Reinforcement Learning in Dynamic Environments

Jung, Kyuyeol;Kim, Incheol;

doi:10.3745/PKIPS.y2020m11a.988

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2020.11a
/
Pages.988-991
/
2020
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

Continual Multiagent Reinforcement Learning in Dynamic Environments

동적 환경에서의 지속적인 다중 에이전트 강화 학습

Jung, Kyuyeol (Department of Computer Science, Kyonggi University) ;
Kim, Incheol (Department of Computer Science, Kyonggi University)

정규열 (경기대학교 컴퓨터과학과) ;
김인철 (경기대학교 컴퓨터과학과)

Published : 2020.11.05

https://doi.org/10.3745/PKIPS.y2020m11a.988 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

다양한 실세계 응용 분야들에서 공동의 목표를 위해 여러 에이전트들이 상호 유기적으로 협력할 수 있는 행동 정책을 배우는 것은 매우 중요하다. 이러한 다중 에이전트 강화 학습(MARL) 환경에서 기존의 연구들은 대부분 중앙-집중형 훈련과 분산형 실행(CTDE) 방식을 사실상 표준 프레임워크로 채택해왔다. 하지만 이러한 다중 에이전트 강화 학습 방식은 훈련 시간 동안에는 경험하지 못한 새로운 환경 변화가 실전 상황에서 끊임없이 발생할 수 있는 동적 환경에서는 효과적으로 대처하기 어렵다. 이러한 동적 환경에 효과적으로 대응하기 위해, 본 논문에서는 새로운 다중 에이전트 강화 학습 체계인 C-COMA를 제안한다. C-COMA는 에이전트들의 훈련 시간과 실행 시간을 따로 나누지 않고, 처음부터 실전 상황을 가정하고 지속적으로 에이전트들의 협력적 행동 정책을 학습해나가는 지속 학습 모델이다. 본 논문에서는 대표적인 실시간 전략게임인 StarcraftII를 토대로 동적 미니게임을 구현하고 이 환경을 이용한 다양한 실험들을 수행함으로써, 제안 모델인 C-COMA의 효과와 우수성을 입증한다.

Keywords

Acknowledgement

이 논문은 정보통신기획평가원의 재원으로 정보통신방송 기술개발사업의 지원을 받아 수행한 연구 과제(클라우드에 연결된 개별 로봇 및 로봇그룹의 작업 계획기술 개발, 2020-0-00096)입니다.

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

Continual Multiagent Reinforcement Learning in Dynamic Environments

동적 환경에서의 지속적인 다중 에이전트 강화 학습

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)