Reinforcement learning packet scheduling using UCB

Kim, Dong-Hyun;Kim, Min-Woo;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong;

Proceedings of the Korean Society of Computer Information Conference (한국컴퓨터정보학회:학술대회논문집)

2019.01a
/
Pages.45-46
/
2019

Korean Society of Computer Information (한국컴퓨터정보학회)

Reinforcement learning packet scheduling using UCB

UCB를 이용한 강화학습 패킷 스케줄링

Kim, Dong-Hyun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
Kim, Min-Woo (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
Lee, Byung-Jun (Dept. of Electrical and Computer Engineering, Sungkyunkwan University) ;
Kim, Kyung-Tae (Dept. of Software, Sungkyunkwan University) ;
Youn, Hee-Yong (Dept. of Electrical and Computer Engineering, Sungkyunkwan University)

김동현 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
김민우 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
이병준 (성균관대학교 정보통신대학 전자전기컴퓨터공학과) ;
김경태 (성균관대학교 소프트웨어대학 소프트웨어학과) ;
윤희용 (성균관대학교 정보통신대학 전자전기컴퓨터공학과)

Published : 2019.01.16

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 Upper Confidence Bound (UCB)를 이용한 효율적인 패킷 스케줄링 기법을 제안한다. 기존 e-greedy 등 강화학습의 보상을 극대화 할 수 있는 행동을 선택하는 것과 다르게, 제안된 UCB를 이용한 강화학습 패킷 스케줄링 기법은 각 상태에서 행동을 선택한 횟수를 추가적으로 고려한다. 이는 보다 효율적인 강화학습의 탐구(Exploration)를 가능케 한다. 본 논문에서는 컴퓨터 시뮬레이션을 통하여 제안하는 UCB를 이용한 강화학습 패킷 스케줄링 기법이 기존의 e-greedy 및 softmax를 기반으로 한 패킷 스케줄링 기법에 비해 정확도 측면에서 향상된 정확도를 보인다.

Proceedings of the Korean Society of Computer Information Conference (한국컴퓨터정보학회:학술대회논문집)

Reinforcement learning packet scheduling using UCB

UCB를 이용한 강화학습 패킷 스케줄링

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)