DOI QR코드

DOI QR Code

Performance Analysis of Object Detection Neural Network According to Compression Ratio of RGB and IR Images

RGB와 IR 영상의 압축률에 따른 객체 탐지 신경망 성능 분석

  • Lee, Yegi (Dept. of Computer Science and Engineering, Konkuk University) ;
  • Kim, Shin (Dept. of Computer Science and Engineering, Konkuk University) ;
  • Lim, Hanshin (Immersive Media Research Laboratory, ETRI) ;
  • Lee, Hee Kyung (Immersive Media Research Laboratory, ETRI) ;
  • Choo, Hyon-Gon (Immersive Media Research Laboratory, ETRI) ;
  • Seo, Jeongil (Immersive Media Research Laboratory, ETRI) ;
  • Yoon, Kyoungro (Dept. of Computer Science and Engineering, Konkuk University)
  • 이예지 (건국대학교 컴퓨터공학과) ;
  • 김신 (건국대학교 컴퓨터공학과) ;
  • 임한신 (한국전자통신연구원 실감미디어연구실) ;
  • 이희경 (한국전자통신연구원 실감미디어연구실) ;
  • 추현곤 (한국전자통신연구원 실감미디어연구실) ;
  • 서정일 (한국전자통신연구원 실감미디어연구실) ;
  • 윤경로 (건국대학교 컴퓨터공학과)
  • Received : 2021.01.12
  • Accepted : 2021.03.03
  • Published : 2021.03.30

Abstract

Most object detection algorithms are studied based on RGB images. Because the RGB cameras are capturing images based on light, however, the object detection performance is poor when the light condition is not good, e.g., at night or foggy days. On the other hand, high-quality infrared(IR) images regardless of weather condition and light can be acquired because IR images are captured by an IR sensor that makes images with heat information. In this paper, we performed the object detection algorithm based on the compression ratio in RGB and IR images to show the detection capabilities. We selected RGB and IR images that were taken at night from the Free FLIR Thermal dataset for the ADAS(Advanced Driver Assistance Systems) research. We used the pre-trained object detection network for RGB images and a fine-tuned network that is tuned based on night RGB and IR images. Experimental results show that higher object detection performance can be acquired using IR images than using RGB images in both networks.

현재 대부분의 객체 탐지 알고리즘은 RGB 영상을 기반으로 연구되고 있다. 하지만 RGB 카메라는 물체에서 반사되는 빛을 받아들여 영상을 생성하기 때문에, 물체에서 나오는 빛이 적거나 산란이 되는 야간 또는 안개가 끼는 환경에서는 물체의 정보가 잘 표현되는 영상 취득이 어려워 객체 탐지의 정확도가 떨어진다. 그에 반해 IR(열 적외선, Infra-Red) 영상은 열 센서로 이미지를 생성하기 때문에 RGB 영상에 비해 정확한 물체의 정보를 표현할 수 있다. 따라서 본 논문에서는 이러한 이미지 특성 차이에 따른 객체 탐지 성능을 비교하고자 하며, RGB와 IR 영상의 압축률에 따른 객체 탐지를 수행하고, 결과를 비교 분석 하고자 한다. 실험에 사용된 영상은 첨단운전자 보조 시스템(ADAS) 연구용 데이터 세트인 Free FLIR Thermal 데이터 세트 중 야간에 촬영된 RGB 영상과 IR 영상을 사용하였으며, 기존 RGB 영상 기반으로 사전 학습된 신경망과 FLIR Thermal 데이터 세트 내 RGB 영상과 IR 영상을 일부 골라 재학습한 신경망을 이용하여 객체 탐지를 수행하였다. 실험 결과 RGB 기반으로 사전 학습된 신경망과 재학습한 신경망 모두 IR 영상 기반 객체 탐지 성능이 RGB 영상 기반 성능보다 월등한 것을 확인할 수 있었다.

Keywords

References

  1. Free FLIR Thermal dataset, https://www.flir.com/oem/adas/dataset/ (accessed Jan, 8, 2020).
  2. Girshick, Ross, et al. "Rich feature hierarchies for accurate object detection and semantic segmentation," Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 580-587, 2014.
  3. Girshick, Ross. "Fast r-cnn," Proceedings of the IEEE international conference on computer vision, pp. 1440-1448, 2015.
  4. Ren, Shaoqing, et al. "Faster r-cnn: Towards real-time object detection with region proposal networks," IEEE transactions on pattern analysis and machine intelligence, Vol. 39, No. 6, pp. 1137-1149, 2016. https://doi.org/10.1109/TPAMI.2016.2577031
  5. Redmon, Joseph, et al. "You only look once: Unified, real-time object detection," Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 779-788, 2016.
  6. Lin, Tsung-Yi, et al. "Focal loss for dense object detection." Proceedings of the IEEE international conference on computer vision, pp. 2980-2988, 2017.
  7. ImageNet dataset, http://image-net.org/index (accessed Jan, 8, 2020).
  8. coco dataset,https://cocodataset.org/#detection-2020 (accessed Jan, 8, 2020).
  9. Liu, Shuo, and Zheng Liu. "Multi-channel CNN-based object detection for enhanced situation awareness." arXiv preprint arXiv:1712. 00075 (2017).
  10. Farahnakian, Fahimeh, et al. "Deep Convolutional Neural Network-based Fusion of RGB and IR Images in Marine Environment," 2019 IEEE Intelligent Transportation Systems Conference (ITSC), pp. 21-26, 2019.
  11. Y.-H. Chao, Y.-C. Sun, J. Xu, X. Xu, "JVET common testconditions and software reference configurations for non4:2:0 colour formats," document JVET -R2013, April. 2020.
  12. detectron2, https://github.com/facebookresearch/detectron2 (accessed Jan, 8, 2020).
  13. AP[0.5:0.95], https://cocodataset.org/#detection-eval (accessed Jan, 8, 2020).