DOI QR코드

DOI QR Code

Implementation of Finger Vein Authentication System based on High-performance CNN

고성능 CNN 기반 지정맥 인증 시스템 구현

  • 김경래 (충북대학교 전파통신공학과) ;
  • 최홍락 (충북대학교 전파통신공학과) ;
  • 김경석 (충북대학교 정보통신공학과)
  • Received : 2021.09.03
  • Accepted : 2021.10.08
  • Published : 2021.10.31

Abstract

Biometric technology using finger veins is receiving a lot of attention due to its high security, convenience and accuracy. And the recent development of deep learning technology has improved the processing speed and accuracy for authentication. However, the training data is a subset of real data not in a certain order or method and the results are not constant. so the amount of data and the complexity of the artificial neural network must be considered. In this paper, the deep learning model of Inception-Resnet-v2 was used to improve the high accuracy of the finger vein recognizer and the performance of the authentication system, We compared and analyzed the performance of the deep learning model of DenseNet-201. The simulations used data from MMCBNU_6000 of Jeonbuk National University and finger vein images taken directly. There is no preprocessing for the image in the finger vein authentication system, and the results are checked through EER.

지정맥을 이용한 생체인식기술은 높은 보안성, 편리성과 정확성으로 많은 관심을 받고 있으며 최근 딥러닝 기술의 발달로 인해 더욱 인증에 대한 인식 오류율 및 정확도가 향상되었다. 하지만 학습 데이터는 일정한 순서나 방법이 아닌 실제 데이터의 부분 집합으로, 결과가 일정하지 않아 데이터양과 인공신경망의 복잡도를 고려해야 한다. 본 논문에서는 지정맥 인식기의 높은 정확도와 인증 시스템 성능 향상을 위해 Inception-ResNet-v2의 딥러닝 모델을 활용하였으며 DenseNet-201의 딥러닝 모델과 성능을 비교 분석하였다. 시뮬레이션은 전북대의 MMCBNU_6000과 직접 촬영한 지정맥 영상을 사용하고 지정맥 인증 시스템에 이미지를 가공하는 과정은 없으며 생체인증 척도인 EER을 추출하여 성능 결과를 확인한다.

Keywords

Ⅰ. 서론

생체인식은 생체정보를 이용하여 개인을 식별 및 인증하는 기술로서, 훼손 및 위조가 어렵고 높은 신뢰성 및 편의성을 제공하는 정보보안기술로 주목받고 있다[1]. 그중 지정맥 인증은 생체인식기술 중 하나로서, 근적외선이 혈액 속에 흐르는 적혈구를 통과하지 못하는 원리를 이용하는 기술이다. 신체적으로 지정맥은 10억 분의 1 이하의 낮은 확률의 비 동일성의 성질이 있으며 같은 손에서도 손가락마다 지정맥이 다르며 성인의 경우 지정맥의 패턴은 시간이 지나도 변하지 않는 불변성으로, 생체인식을 위한 높은 보안성과 정확성의 효율성 있는 접근방식을 제공한다. 하지만 보다 높은 보안성과 정확성을 위해서는 인증 알고리즘에 대한 정밀한 검토가 필요하다[2].

최근 딥러닝(Deep Learning) 기술의 발전으로 이미지 인식 기술이 성장하면서 인식 오류율 및 정확도가 향상되었다. 딥러닝은 이미지 식별 등 다양한 분야에서 사람의 개입 없이 컴퓨터가 스스로 특징적 학습을 하여 사람의 작업을 대신 수행하는 기계학습 기술이다. 하지만 학습 데이터를 과하게 학습할 경우 반대로 Overfitting 으로 인해 학습 능력이 저하될 수 있다. 학습 데이터는 실제 데이터의 부분 집합이며 실제 데이터를 모두 수집하는 것은 불가능하므로 학습 데이터에 대해서는 오차가 감소하지만, 실제 데이터에 대해서는 오차가 증가하게 된다. 따라서, 딥러닝을 사용하기 위해 적절한 데이터양과 인공신경망의 복잡도를 구성하는 것이 중요하다[3].

이전 연구[4]에서 지정맥 인식에 딥러닝 기술을 활용하여 근적외선의 세기에 의한 성능과 주변 환경의 가시광선이 인식 성능에 끼치는 직접적인 영향을 분석하기 위해 직접 환경을 구성하여 촬영 및 시뮬레이션을 하였다. 시뮬레이션 결과를 통해 근적외선이 일정량 이상 또는 이하의 세기이면 성능이 낮아지는 것을 알 수 있었고 지정맥 인식기의 주변 가시광선의 영향이 적을수록 정확도가 높아지는 것을 알 수 있었다. 본 논문에서는 지정맥인증에 있어서 더 보안성이 높은 시스템을 구성해보고자 이전 연구[4]와 다른 딥러닝 모델을 사용하고 최적화 변수들을 변경하여 인증 과정에서 더 높은 정확도와 인식률을 실현하고자 한다.

이하 본 논문의 구성은 다음과 같다. Ⅱ장에서는 지정맥 인식기 구조 및 환경 구성에 관해 설명하고 Ⅲ장은 지정맥 인증 기술의 CNN 모델, Ⅳ장에서는 지정맥 인증 시뮬레이션 결과를 설명하고 Ⅴ장에서 결론을 맺는다.

Ⅱ. 지정맥 인식기 구조 및 환경 구성

지정맥 인식기는 근적외선 빛을 정맥의 적혈구가 흡수하는 특성을 이용하여 정맥의 음영 이미지를 카메라로 촬영하여 획득한다. 지정맥 촬영 장치의 하드웨어 구성은 이전 연구[4]에서 제작한 지정맥 인식기를 사용하며 이전에 개발된 지정맥 인증 시스템과 성능을 비교하기 위해 이전 연구[4]와 동일하므로 Raspberry Pi와 850nm 의 파장을 출력하는 적외선 LED, ABS 소재로 제작한 촬영 구조물 그리고 카메라로 구성된다. 광원이 가깝고 손가락에 전달되는 적외선의 세기가 매우 강하면 혈관이 광원의 빛에 의해 음영 이미지가 가려지면서 혈류가 선명하게 보이지 않아 지정맥 인증이 불가능할 것으로 추정되어 촬영환경 구성은 다음 그림 1과 같다.

OTNBBE_2021_v21n5_197_f0001.png 이미지

그림 1. 지정맥 인식기 촬영환경 구성

Fig. 1. Configuration of the shooting environment of the finger vein recognizer

이전 연구[4]에서 성능이 가장 좋게 측정된 환경으로, 그림 2와 같이 4개의 적외선 LED를 사용하며 적외선 LED 배치는 오른쪽에만 여유 공간을 두고 배치하고 왼쪽에는 아무것도 없도록 막아 두었다.

OTNBBE_2021_v21n5_197_f0002.png 이미지

그림 2. 지정맥 인식기 촬영 환경

Fig. 2. The shooting environment of the finger vein recognizer

주변 환경은 다음 그림 3과 같이 카메라 입사되는 가시광선 영향이 가장 적은 실내조명을 모두 불을 끈 환경에서 실험하였다.

OTNBBE_2021_v21n5_197_f0003.png 이미지

그림 3. 지정맥 인식기 주변 환경 구성

Fig. 3. Configuration of the surrounding environment of the finger vein recognizer

Ⅲ. 지정맥 인증 기술의 CNN 모델

다음 그림 4와 같이 지정맥 인증 시스템은 지정맥 인식기를 통해 촬영한 이미지를 바로 학습시키고 이미지 매칭을 통해 생체 인식 성능을 추출하도록 하였으며 본 논문에서는 지정맥 인증을 위해 이전 연구[4]에서 사용했던 DenseNet-201과 다른 특징을 가지고 있는 Inception-ResNet-v2 모델을 사용하였다.

OTNBBE_2021_v21n5_197_f0004.png 이미지

그림 4. 지정맥 인증 시스템

Fig. 4. Finger vein authentication system

표1에서 딥러닝의 Layer 수를 먼저 비교해보면 Convolution 및 ReLU Layer가 DenseNet-201에서는 200개이지만 Inception-ResNet-v2는 132개의 Layer 로 구성되어 있다. Inception-ResNet-v2는 Inception block에 ResNet의 Residual block을 합친 모델이다.

표 1. 딥러닝 Layer 수 비교

Table 1. Comparison of the number of deep learning layers

OTNBBE_2021_v21n5_197_t0001.png 이미지

Residual block은 딥러닝의 주요 문제인 기울기가 소실되거나 발산하는 문제를 해결하기 위해 그림 5와 같이 출력에 이전 Layer에서 학습했던 정보를 연결함으로써 해당 층에서는 추가로 학습해야 할 정보만을 Mapping 하게 된다.

OTNBBE_2021_v21n5_197_f0005.png 이미지

그림 5. 잔여 블록 구조

Fig. 5. Residual block structure

지정맥 인증 시스템의 성능 고도화를 위해 다음 그림 6과 같은 Inception-ResNet-v2는 구조를 사용하여 학습하고 결과를 분석한다[5]. Inception-ResNet–A, B, C에서는 Convolution block으로 동작하고 Reduction-A는 Grid size를 35×35에서 17×17로 줄이고 Reduction-B는 17×17에서 8×8로 줄일 때 사용하는 Reduction module이다. Inception-ResNet-v2의 핵심적인 특징은 Conv Filter Factorization, Avoid representational bottleneck으로 크게 2가지가 있다[6].

OTNBBE_2021_v21n5_197_f0006.png 이미지

그림 6. Inception-ResNet-v2 구조

Fig. 6. Inception-ResNet-v2 structure

OTNBBE_2021_v21n5_197_f0007.png 이미지

그림 7. 필터 분해 구조

Fig. 7. Structure of Filter Factorization

먼저 Conv Filter Factorization은 그림 7과 같이 연산의 복잡도를 줄이기 위해 5×5 conv를 3×3 conv 2 개로 대체한다. 5×5 conv는 한 번의 비선형 함수가 적용되는 반면 3×3 conv는 두 번의 비선형 함수가 적용되면서 특징 식별성이 증가하게 되고 학습 파라미터 수 또한 감소하게 된다. 여기서 더 나아가 연산량은 줄고 Receptive Field는 동일하다는 특징을 이용하여 n×n conv를 1×n + n×1 conv로 쪼개는 방법을 사용한다. Receptive Field는 각 단계의 입력 이미지에 대해 하나의 필터가 커버할 수 있는 이미지 영역의 일부를 뜻한다.

OTNBBE_2021_v21n5_197_f0008.png 이미지

그림 8. 병목 현상 방지 구조

Fig. 8. Structure of preventing bottlenecks

다음 Avoid representational bottleneck은 그림 8 과 같이 먼저 Pooling을 하면 Feature map의 size가 줄어들면서 정보량이 줄어드는 Representational bottleneck이 발생하고 Pooling을 뒤에 하면 연산량이 많아진다. 그래서 연산량도 줄이면서 Representational bottleneck도 피하고자 Convolution과 Pooling을 병렬로 처리한다.

딥러닝 모델이 변경되면서 입력 데이터의 크기는 224 ×224에서 299×299로 변경하였으며 Neural network의 가중치를 조절하는 과정을 Adagrad에서 SGD(Stochastic Gradient Descent)로 변경하였다. 학습률, SGD를 적절한 방향으로 가속하며 진동 폭을 줄이는 Momentum 매개변수와 업데이트마다 적용되는 학습률의 감소율을 사용했다. 또한, Momentum이 이동시킬 방향으로 미리 이동해서 Gradient를 계산하도록 하여 불필요한 이동을 줄이는 Nesterov Momentum을 적용하였다.

Ⅳ. 지정맥 인증 시뮬레이션 결과

지정맥 인증 시뮬레이션은 표2와 같이 손가락 이미지가 총 6, 000개의 640×480 해상도로 구성된 전북대학교 멀티미디어 연구소에서 제작한 MMCBNU_6000 데이터베이스[7]와 제작된 지정맥 인식기로 그림 9과 같이 3명의 오른쪽 검지의 지정맥 이미지를 각 10개씩 획득하여 총 6, 030개의 데이터를 토대로 결과를 추출한다.

표 2. 시뮬레이션 데이터

Table 2. Simulation data

OTNBBE_2021_v21n5_197_t0002.png 이미지

OTNBBE_2021_v21n5_197_f0009.png 이미지

그림 9. 획득한 지정맥 이미지

Fig. 9. Acquired finger vein image

시뮬레이션의 결과 성능 지표로서, EER(Equal Error Rate)을 추출하여 결과를 비교 분석한다. 높은 정밀도와 정확도를 제공하기 위해서는 지정맥의 패턴 인식을 수행하는 과정에서 시스템에 등록된 사용자 외 다른 사람을 등록자로 오인하고 인증을 수행하는 오류(타인 수락률)를 나타내는 FAR(False Access Rate)과 시스템에 등록된 사용자가 사용 시 본인임을 확인하지 못하고 인증을 거부하는 오류(본인 거부율)를 나타내는 FRR(False Rejection Rate)이 같아지는 지점인 EER을 낮추는 것이 중요하다[8].

OTNBBE_2021_v21n5_197_f0010.png 이미지

그림 10. 시뮬레이션 회차별 EER 결과

Fig. 10. EER results per simulation run

다음 그림 10은 시뮬레이션 50번 테스트했을 때 Error Rate를 나타낸 그래프이다. EER은 최대 0.006491%, 최소 0%로 측정되었다.

시뮬레이션 결과, 그림 11과 같이 FAR과 FRR이 만나지 않아 EER이 0%인 성능 그래프도 도출되었지만, 최대 0.006491%인 결과도 측정되었다. 데이터의 양이 적을 때 해당 데이터의 특정 패턴이나 노이즈까지 쉽게 암기될 수 있고 Overfitting으로 인해 알고리즘의 오차가 증가할 가능성이 있다.

OTNBBE_2021_v21n5_197_f0011.png 이미지

그림 11. EER 성능 그래프

Fig. 11. Graph of EER performance

보안성에 대한 요구사항을 입증하기 위해 시뮬레이션은 총 50번 테스트하여 결과를 추출하였으며 EER은 0%에서 최대 0.006491% 최대 정확도는 100%에서 최소 99.5%의 성능이 나타났다. 표3에서 확인할 수 있듯이 평균 인식률의 정확도는 99.9562%이며 평균 EER은 0.00015714%로 나타났다.

표 3. 시뮬레이션 결과

Table 3. Simulation results

OTNBBE_2021_v21n5_197_t0003.png 이미지

Ⅴ. 결론

생체인식 기술은 현대 사회에서 점점 더 중요한 역할을 하고 있으며 그 중 지정맥 인식은 편리하고 높은 정확도로 안전한 접근 방식을 제공한다. 본 논문에서는 지정맥 인증에 더 높은 정확도와 정밀도 높은 정보를 제공하기 위해 Inception-ResNet-v2의 딥러닝 모델을 사용하여 시뮬레이션을 분석하였다. 그 결과, 제안한 딥러닝 모델의 평균 인식률의 정확도는 99.9562%이고 평균 EER은 0.00015714%로 이전 연구[4]에서 사용했던 알고리즘보다 성능이 더 우수하다는 것을 알 수 있다.

표 4. 딥러닝 결과 비교

Table 4. Comparison of deep learning results

OTNBBE_2021_v21n5_197_t0004.png 이미지

CNN의 우수한 성능을 고려하여 향후 지정맥 인식에 대한 다양한 딥러닝 기법으로 더 많은 연구가 진행될 것이라 예상되며 본 연구가 인증뿐만이 아닌 건강관리 등 여러 분야에서 응용될 수 있기를 기대한다.

References

  1. U. Uludag, S. Pankanti, S. Prabhakar, and A. K. Jain, "Biometric Cryptosystems: Issues and Challenges", Proceeding of the IEEE, Vol. 92, No. 6, pp. 948-960, Jun. 2004. DOI: https://doi.org/10.1109/JPROC.2004.827372
  2. A. K, Jain and S. Prabhakar, "An Introduction to Biometric Recognition", IEEE Transactions on Circuits and Systems for Video Technology, Vol. 14, No. 1, pp. 4-20, Jan. 2004. DOI: https://doi.org/10.1109/TCSVT.2003.818349
  3. Mikhail Belkin, Daniel Hsu, Siyuan Ma, and Soumik Mandal, "Reconciling modern machine learning and the bias-variance trade-of", arXiv preprint arXiv: 1812.11118, 2018.
  4. K.R. Kim, H.R. Choi, K.S. Kim, "Design and Implementation of Side-Type Finger Vein Recognizer", The Journal of The Institute of Internet, Broadcasting and Communication (JIIBC), Vol.21, No.3, pp. 159-168, 2021. DOI: https://doi.org/10.7236/JIIBC.2021.21.3.159
  5. C. Szegedy, S. Ioffe, V. Vanhoucke, A. Alemi, "Inception-V4, inception-ResNet and the impact of residual connections on learning", in Proc. AAAI, pp. 1-3, 2017.
  6. C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, "Going deeper with convolutions", arXiv preprint arXiv:1409.4842, 2014.
  7. Y. Lu, S.J. Xie, Z. Wang, S. Yoon and D.S. Park, "An Available Database for the Research of Finger Vein Recognition", 2013 6th International Congress on Image and Signal Processing (CISP), pp. 410-415, 2013. DOI: https://doi.org/10.1109/CISP.2013.6744030
  8. J.H. Moon, H.I. Kim, "A Study on Standards for Performance Evaluation of Biometric Recognition Systems", Journal of the Korea Institute of Information Security & Cryptology, Vol. 12, No. 2, pp. 101-110, 2002. https://doi.org/10.13089/JKIISC.2002.12.2.101