Real-time 3D Pose Estimation of Both Human Hands via RGB-Depth Camera and Deep Convolutional Neural Networks

Park, Na Hyeon;Ji, Yong Bin;Gi, Geon;Kim, Tae Yeon;Park, Hye Min;Kim, Tae-Seong;

doi:10.3745/PKIPS.y2018m10a.686

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2018.10a
/
Pages.686-689
/
2018
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

Real-time 3D Pose Estimation of Both Human Hands via RGB-Depth Camera and Deep Convolutional Neural Networks

RGB-Depth 카메라와 Deep Convolution Neural Networks 기반의 실시간 사람 양손 3D 포즈 추정

Park, Na Hyeon (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University) ;
Ji, Yong Bin (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University) ;
Gi, Geon (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University) ;
Kim, Tae Yeon (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University) ;
Park, Hye Min (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University) ;
Kim, Tae-Seong (Dept. of Biomedical Engineering, College of Electronics and Information, Kyung Hee University)

박나현 (경희대학교 생체의공학과) ;
지용빈 (경희대학교 생체의공학과) ;
기건 (경희대학교 생체의공학과) ;
김태연 (경희대학교 생체의공학과) ;
박혜민 (경희대학교 생체의공학과) ;
김태성 (경희대학교 생체의공학과)

Published : 2018.10.31

https://doi.org/10.3745/PKIPS.y2018m10a.686 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

3D 손 포즈 추정(Hand Pose Estimation, HPE)은 스마트 인간 컴퓨터 인터페이스를 위해서 중요한 기술이다. 이 연구에서는 딥러닝 방법을 기반으로 하여 단일 RGB-Depth 카메라로 촬영한 양손의 3D 손 자세를 실시간으로 인식하는 손 포즈 추정 시스템을 제시한다. 손 포즈 추정 시스템은 4단계로 구성된다. 첫째, Skin Detection 및 Depth cutting 알고리즘을 사용하여 양손을 RGB와 깊이 영상에서 감지하고 추출한다. 둘째, Convolutional Neural Network(CNN) Classifier는 오른손과 왼손을 구별하는데 사용된다. CNN Classifier 는 3개의 convolution layer와 2개의 Fully-Connected Layer로 구성되어 있으며, 추출된 깊이 영상을 입력으로 사용한다. 셋째, 학습된 CNN regressor는 추출된 왼쪽 및 오른쪽 손의 깊이 영상에서 손 관절을 추정하기 위해 다수의 Convolutional Layers, Pooling Layers, Fully Connected Layers로 구성된다. CNN classifier와 regressor는 22,000개 깊이 영상 데이터셋으로 학습된다. 마지막으로, 각 손의 3D 손 자세는 추정된 손 관절 정보로부터 재구성된다. 테스트 결과, CNN classifier는 오른쪽 손과 왼쪽 손을 96.9%의 정확도로 구별할 수 있으며, CNN regressor는 형균 8.48mm의 오차 범위로 3D 손 관절 정보를 추정할 수 있다. 본 연구에서 제안하는 손 포즈 추정 시스템은 가상 현실(virtual reality, VR), 증강 현실(Augmented Reality, AR) 및 융합 현실 (Mixed Reality, MR) 응용 프로그램을 포함한 다양한 응용 분야에서 사용할 수 있다.

Keywords

Acknowledgement

Supported by : 한국연구재단

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

Real-time 3D Pose Estimation of Both Human Hands via RGB-Depth Camera and Deep Convolutional Neural Networks

RGB-Depth 카메라와 Deep Convolution Neural Networks 기반의 실시간 사람 양손 3D 포즈 추정

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)