DOI QR코드

DOI QR Code

Reinforcement learning-based behavior control of a grid-type system for sorting parcels

소포물 분류를 위한 그리드 타입 시스템의 강화 학습 기반 행동 제어

  • Choi, Ho-Bin (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Kim, Ju-Bong (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Hwang, Gyu-Young (Dept. of Computer Science Engineering, KoreaTech University) ;
  • Han, Youn-Hee (Dept. of Computer Science Engineering, KoreaTech University)
  • 최호빈 (한국기술교육대학교 컴퓨터공학과) ;
  • 김주봉 (한국기술교육대학교 컴퓨터공학과) ;
  • 황규영 (한국기술교육대학교 컴퓨터공학과) ;
  • 한연희 (한국기술교육대학교 컴퓨터공학과)
  • Published : 2020.05.29

Abstract

공정 데이터를 실시간으로 수집할 수 있는 스마트 팩토리의 장점을 활용하여, 일반적인 기계 학습 대신 강화 학습을 사용한다면 미리 요구되는 훈련 데이터 없이 행동 제어를 할 수 있다. 하지만, 현실 세계에서는 물리적 마모, 시간적 문제 등으로 인해 수천만 번 이상의 반복 학습이 불가능하다. 따라서, 본 논문에서는 시뮬레이터를 활용해 스마트 팩토리 분야에서 복잡한 환경 중 하나인 이송 설비에 초점을 둔 그리드 분류 시스템을 개발하고 협력적 다중 에이전트 기반의 강화 학습을 설계하여 효율적인 행동 제어가 가능함을 입증한다.

Keywords