Vibration Anomaly Detection of One-Class Classification using Multi-Column AutoEncoder

Sang-Min, Kim;Jung-Mo, Sohn;

doi:10.9708/jksci.2023.28.02.009

Journal of the Korea Society of Computer and Information (한국컴퓨터정보학회논문지)

Volume 28 Issue 2
/
Pages.9-17
/
2023
/
1598-849X(pISSN)
/
2383-9945(eISSN)

Korean Society of Computer Information (한국컴퓨터정보학회)

DOI QR Code

Vibration Anomaly Detection of One-Class Classification using Multi-Column AutoEncoder

Sang-Min, Kim (Epozen's research institute) ;
Jung-Mo, Sohn (Epozen's research institute)

Received : 2022.12.28
Accepted : 2023.01.31
Published : 2023.02.28

https://doi.org/10.9708/jksci.2023.28.02.009 Citation PDF HTML

Download PDF

⟨ Previous Next ⟩

Abstract

In this paper, we propose a one-class vibration anomaly detection system for bearing defect diagnosis. In order to reduce the economic and time loss caused by bearing failure, an accurate defect diagnosis system is essential, and deep learning-based defect diagnosis systems are widely studied to solve the problem. However, it is difficult to obtain abnormal data in the actual data collection environment for deep learning learning, which causes data bias. Therefore, a one-class classification method using only normal data is used. As a general method, the characteristics of vibration data are extracted by learning the compression and restoration process through AutoEncoder. Anomaly detection is performed by learning a one-class classifier with the extracted features. However, this method cannot efficiently extract the characteristics of the vibration data because it does not consider the frequency characteristics of the vibration data. To solve this problem, we propose an AutoEncoder model that considers the frequency characteristics of vibration data. As for classification performance, accuracy 0.910, precision 1.0, recall 0.820, and f1-score 0.901 were obtained. The network design considering the vibration characteristics confirmed better performance than existing methods.

본 논문에서는 베어링의 결함 진단을 위한 단일 클래스 분류의 진동 이상 탐지 시스템을 제안한다. 베어링 고장으로 인해 발생하는 경제적 및 시간적 손실을 줄이기 위해 정확한 결함 진단시스템은 필수적이며 문제 해결을 위해 딥러닝 기반의 결함 진단 시스템들이 널리 연구되고 있다. 그러나 딥러닝 학습을 위한 실제 데이터 채집 환경에서 비정상 데이터 확보에 어려움이 있으며 이는 데이터 편향을 초래한다. 이에 정상 데이터만 활용하는 단일 클래스 분류 방법을 활용한다. 일반적인 방법으로는 AutoEncoder를 통한 압축과 복원 과정을 학습하여 진동 데이터의 특성을 추출한다. 추출된 특성으로 단일 클래스 분류기를 학습하여 이상 탐지를 실시한다. 하지만 이와 같은 방법은 진동 데이터의 주파수 특성을 고려하지 않아서 진동 데이터의 특성을 효율적 추출할 수 없다. 이러한 문제를 해결하기 위해 진동 데이터의 주파수 특성을 고려한 AutoEncoder 모델을 제안한다. 분류 성능은 accuracy 0.910, precision 1.0, recall 0.820, f1-score 0.901이 나왔다. 주파수 특성을 고려한 네트워크 설계로 기존 방법들보다 우수한 성능을 확인하였다.

Keywords

I. Introduction

베어링은 자동차, 산업용 기계, 생활가전 등 여러 산업분야에서 필수적인 부품으로 사용되고 있다. 나아가 일상생활에서 자주 사용하는 냉장고, 에어컨, 세탁기, 청소기 등 보이지 않는 기계 내부에 위치하여 구동되고 있으며 기계산업에서 중요한 역할을 한다. 베어링은 일반적으로 궤도륜, 전동체, 케이지로 구성되어있고 내륜과 외륜 사이에 여러 개의 전동체를 배치해서 서로 접촉하지 않도록, 케이지에 의해서 일정한 간격을 유지하고 있는 구조이다. 베어링은 회전하고 있는 기계에 축을 일정한 위치에 고정시키고 자중과 축에 걸리는 하중을 지지하면서 축을 회전시키는 역할을 하는 기계요소다. 베어링의 사용으로 기계의 작동 효율을 높이고 움직이는 기계 부품의 위치를 고정하며 마찰열에 의한 변형을 방지하여 기계의 고장을 방지한다.

이러한 베어링은 기본적으로 마찰에 노출되어 있기 때문에 정격 수명이 존재한다[1]. 정격 수명이란 하나의 통계치로서 일군의 같은 베어링을 동일한 조건에서 각각 운전하였을 때, 이 중 90%가 구름 피로(Flaking)에 의한 손상을 일으키지 않고 회전할 수 있는 총회전수 또는 총 회전시간을 의미한다. 베어링의 정격 수명은 부하 능력, 실제 작용하는 하중, 온도 등의 요인에 의해 계산할 수 있다. 하지만, 실제 환경에서는 이물질이나 부식/에칭, 윤활 불량, 과부하, 정렬 불량, 취급 손상 등 다양한 원인으로 고장을 유발할 수 있기 때문에 정확한 고장 시점을 예측하기는 어렵다. 또한, 베어링의 고장이 발생하면 장비가 제대로 동작하지 않아 생산성이 감소하고 막대한 시간적, 경제적 손실을 불러일으킨다. 그렇기 때문에 베어링의 결함 진단은 필수적이며 문제 해결을 위해 다양한 연구가 진행되고 있다[2].

베어링의 결함 진단 방법으로는 고속 푸리에 변환(Fast Fourier Transform, FFT), 웨이블릿(Wavelet), 포락선 스펙트럼(Envelope Spectrum) 분석 등 다양한 방법들이 존재한다[3][4]. 최근에는 결함 진단을 위한 방법론으로 딥러닝 기반의 인공지능 기술들이 주목받고 있다[5][6]. 딥러닝 기반의 결함 진단 기술은 충분한 학습 데이터를 기반으로 정상(Normal) 데이터와 비정상(Abnormal) 데이터를 통해 인공신경망(Neural Network)을 학습하여 이상 탐지를 수행한다. 하지만, 실제 환경에서 적용했을 때의 성능은 좋지 못하다. 첫 번째 원인으로 학습 데이터의 채집 과정에 문제가 있다. 실제 데이터 채집 환경에서 비정상 데이터 채집을 위해서는 베어링의 결함이 발생해야 한다. 하지만, 베어링의 비정상 동작을 예측하기 어렵고 발생 빈도가 낮기 때문에 비정상 데이터 확보의 어려움이 있다. 정상 데이터에 비해 부족한 비정상 데이터의 데이터는 데이터 편향성(Bias)을 가지며 학습에 이용 시 잘못된 학습 결과를 초래 할 수 있다. 두 번째는 인위적인 결함을 통한 비정상 데이터 사용이다. 자연적인 발생의 비정상 데이터 확보가 어렵기 때문에 고의로 베어링에 결함을 발생시킨다. 확보한 비정상 데이터로 모델을 학습하는 경우 고의적 결함 데이터가 실제 데이터와 차이가 발생하며 실제 환경에서의 이상탐지는 제대로 동작하지 않을 수 있다. 이러한 일반적인 지도학습(Supervised learning) 방법으로 데이터 확보에서 한계점이 존재하며 이를 위해 단일 클래스 분류(One-Class Classification) 방법을 이용하고자 한다[7].

베어링 이상 탐지에서 사용되는 단일 클래스 분류는 오직 정상 데이터만을 이용해 모델을 학습한 후, 정상 데이터와 거리가 먼 데이터들을 이상치로 판별하는 방법이다. 대표적인 방법으로는 단일 클래스 서포터 벡터 머신(One-Class Support Vector Machine, OC-SVM)이 있다[8]. 이미지 분야에서는 하이브리드 방식으로 AutoEncoder와 OC-SVM을 활용한 방법이 있다[9]. AutoEncoder의 입력과 라벨에 동일한 데이터로 학습하여 데이터 특성을 추출한다. 그리하여 얻은 이미지의 압축된 특성을 기반으로 OC-SVM을 학습한다. 마찬가지로 OC-SVM 또한 정상 데이터의 특성만으로 분포를 학습하게 된다. 최종적으로 학습이 완료된 OC-SVM으로 이상 탐지를 수행한다. 특성 추출을 위한 모델로 1D Convolutional AutoEncoder를 사용한다. 또한, 진동 데이터의 Time Series 특성을 이용하여 LSTM AutoEncoder로 진동 데이터의 특성을 추출하여 이상 탐지를 수행하는 방법도 존재한다[10]. 하지만, 이러한 특성 추출 방식들은 진동 데이터의 주파수 특성을 고려하지 않았다. 일반적으로 진동 데이터는 특정 Sampling rate를 기준으로 채집되었으며 시간 영역(Time Domain)에서 샘플 단위로 표현된다. 시간적 특성이 있지만 주파수 특성을 제대로 가지고 있지 않은 문제가 존재한다.

본 논문에서는 진동 데이터의 주파수 특성을 고려한 특성 추출 모델을 제안하고자 한다. 2장에서는 특성 추출을 위한 베이스라인 모델과 제안하는 모델을 소개한다. 3장에서는 실험 설정 환경과 특성 추출 모델에 따른 성능을 비교하고 마지막 4장에서는 진동 이상 탐지의 결론을 제시한다.

II. Preliminaries

본 연구는 진동 데이터의 특성 추출 단계와 정상과 비정상을 나누는 분류 단계로 베어링 결함 진단을 실행한다. 정상 동작하는 베어링의 진동 데이터만을 네트워크 학습에 사용하였으며 최종 테스트는 비정상 데이터와 정상 데이터로 이루어졌다. Fig. 1과 같이 하이브리드 방식의 프로세스를 따라서 이상 탐지를 수행한다[9]. AutoEncoder 구조의 네트워크를 통해 압축과 복원의 학습을 진행한다. 학습 완료된 AutoEncoder의 Encoder를 피드 포워드(FeedFoward)하여 데이터의 특성을 추출한다. 마지막으로 추출된 특성을 단일 분류기의 입력으로 정상, 비정상으로 분류하여 이상 탐지를 수행한다. 베이스라인으로는 Convolutional AutoEncoder와 LSTM AutoEncoder로 설정하였다.

CPTSCQ_2023_v28n2_9_f0001.png 이미지

Fig. 1. Vibration Anomaly Detection Process with One-Class Classification

1. Feature extraction

1.1 Convolutional AutoEncoder

진동 데이터에 따라 1D Convolutional AutoEncoder를 사용하여 특성을 추출하고 단일 클래스 분류기를 통해 이상 탐지를 수행한다. Convolutional AutoEncoder를 이용한 전반적인 이상 탐지 프로세스는 Fig. 2처럼 진행된다.

CPTSCQ_2023_v28n2_9_f0002.png 이미지

Fig. 2. Anomaly Detection Process of Convolutional AutoEncoder

Fig. 3은 Convolutional AutoEncoder의 구조를 나타낸 것이다. Encoder는 6개의 Convolutional layer로 이루어져 있으며 모든 kernel 크기는 3이고 stride가 2이다. channel은 12이며 마지막 layer만 64로 구성되어있다. Decoder는 6개의 Transposed Convolutional layer로 이루어져 있으며 모든 kernel 크기는 3이고 stride가 2이다. channel은 12이며 마지막 layer만 3으로 구성되어있다.

CPTSCQ_2023_v28n2_9_f0003.png 이미지

Fig. 3. Architecture of Convolutional AutoEncoder

1.2 LSTM AutoEncoder

시계열 데이터란 일정한 시간 동안 수집된 일련의 순차적으로 정해진 데이터이다. 시계열 데이터의 특징으로는 시간에 관해 순서가 매겨져 있는 시퀀스 특성을 가지며 연속한 관측치는 서로 상관관계를 가지고 있다. 진동 데이터 또한 일정 시간 동안 수집된 시계열 데이터 종류 중 하나이다. 이러한 시계열에 대표적인 모델로 RNN, LSTM 등이 있다.

LSTM AutoEncoder를 이용한 이상 탐지 프로세스는 Fig. 4와 같이 진행된다. LSTM AutoEncoder는 시계열 데이터에 대칭적 구조의 Encoder-Decoder LSTM 아키텍처를 적용한 구조이며 기존 Convolutional AutoEncoder보다 진동 데이터의 시퀀스 특징을 고려한 모델이라고 할 수 있다[10]. Convolutional AutoEncoder와 마찬가지로 정상 진동 데이터를 입력으로 받아 정상 진동 데이터를 출력하는 학습을 수행한다. Fig. 5는 LSTM AutoEncoder의 구조를 나타낸 것이다. Encoder는 3개의 LSTM layer로 이루어져 있으며 units는 순서대로 3, 64, 1로 구성되어있다. Decoder도 3개의 LSTM layer로 이루어져 있으며 units은 역순으로 1, 64, 3으로 구성되어있다.

CPTSCQ_2023_v28n2_9_f0004.png 이미지

Fig. 4. Anomaly Detection Process of LSTM AutoEncoder

CPTSCQ_2023_v28n2_9_f0005.png 이미지

Fig. 5. Architecture of LSTM AutoEncoder

2. Classifier

2.1 One Class SVM

이상 탐지 분야에서 기본적으로 사용되는 알고리즘으로 N 차원으로 표현된 데이터들과 원점과의 거리를 기준으로 Hyper Plane을 통해 분류하는 방법이다[7]. 본 논문에서는 진동 이상 탐지를 위한 단일 분류 모델로 OC-SVM을 사용한다.

CPTSCQ_2023_v28n2_9_f0006.png 이미지

Fig. 6. One Class SVM

일반적인 SVM과는 분명한 차이가 존재한다. 주로 이진분류(Binary Classification)로 많이 사용되는 SVM은 각 데이터의 Support Vector 간의 Margin을 기준으로 Hyper Plane을 나누지만, OC-SVM은 원점을 기준으로 하여 조건에 따라 데이터가 아무리 많아도 Class가 1개일 수 있다.

OC-SVM은 정상 데이터를 Feature Space로 옮기며 정상 데이터를 최대한 원점에서 멀어지도록 한다. N 차원으로 맵핑된 데이터들을 대상으로 Hyper Plane이라는 선을 그어 원점과의 거리에 따라 분류를 수행한다. 이때, 원점에서 Hyper Plane까지의 거리를 ρ라고 하며 데이터와 원점 사이의 거리가 ρ보다 크면 Hyper Plane 바깥에 위치하며 정상으로 판단하고, ρ보다 작으면 Hyper Plane 안쪽에 위치하며 비정상으로 판단한다.

\(\begin{aligned}\begin{array}{l}\min \frac{1}{2}|| W||^{2}+\frac{1}{v l} \sum_{i=1}^{l} \xi_{i}-\rho \\ \text { s.t. } W . \quad \Phi\left(x_{i}\right) \geq \rho-\xi_{i} \\ i=1,2, \cdots, l, \quad \xi_{i} \geq 0\end{array}\end{aligned}\) (1)

OC-SVM에서 분류를 위한 핵심은 판단 기준이 되는 Hyper Plane을 구하는 것이며 최적화 문제에 대한 목적함수는 식 (1)과 같이 나타낸다. 식 (1)은 3가지 텀인 \(\begin{aligned}\frac{1}{2}|| W||^{2}\end{aligned}\), \(\begin{aligned}\frac{1}{v l} \sum_{i=1}^{l} \xi_{i}\end{aligned}\), ρ로 이루어져 있다. 첫 번째로 \(\begin{aligned}\frac{1}{2}|| W||^{2}\end{aligned}\)은 Regularization에 해당하는 텀으로 W를 최소화한다. 즉, 각 데이터에 따라 모델의 변동성이 최소화되도록 보정하는 역할을 수행한다. 두 번째로 \(\begin{aligned}\frac{1}{v l} \sum_{i=1}^{l} \xi_{i}\end{aligned}\) 텀이다. ξ_i은 i번째 데이터와 Hyper Plane까지의 거리를 의미하며 경계면 조건을 만족하지 못하는 정상 데이터에 부여되는 페널티를 부여하는 역할이다. 다시 말해, Hyper Plane 바깥쪽에 위치해야 할 정상 데이터가 Hyper Plane 안쪽에 위치하여 비정상 영역에 속해있는 경우 부여되는 페널티다. 마지막으로 ρ는 원점에서 최대한 멀리 떨어지도록 하는 Hyper Plane과의 거리를 의미한다. ρ는 거리를 나타내기 때문에 항상 양수 값을 가지며 OC-SVM은 식 (1)에 따라 목적 함수를 최소화하는 방향으로 학습을 진행하게 된다.

III. The Proposed Scheme

특성 추출 단계에서 진동 데이터의 주파수 특성을 고려한 Multi-Column AutoEncoder를 제안한다.

1. Proposed Model

1.1 Dilated Convolution

기존 모델과 다른 점으로는 크게 두 가지가 있다. 첫 번째로는 Convolutional AutoEncoder의 일반적인 Convolution에서 Dilation을 추가한 Dilated Convolution을 사용하였다. Dilated Convolution은 kernel 사이의 간격을 확장하여 Convolution을 수행하여 넓은 수용 영역(Receptive field)을 확보할 수 있다[11]. Fig. 7을 보면 Dilated Convolution과 일반적인 Convolution의 차이를 확인할 수 있다. layer 개수, kernel 크기가 동일한 조건에서 Dilation의 차이만으로 수용 영역 확장을 확인할 수 있다. 수용 영역 확장은 하나의 샘플 값을 구하는데 많은 입력값을 참고한다는 의미이다. 수용 영역이 넓을수록 더 많은 입력 정보를 사용하기 때문에 성능적 측면에서 우수하다고 할 수 있다.

CPTSCQ_2023_v28n2_9_f0007.png 이미지

Fig. 7. Comparison of Dilated Convolution and Convolution

1.2 Multi-Column AutoEncoder

두 번째는 진동 데이터의 주파수 특성을 고려한 특성 추출이다. Convolutional AutoEncoder에서는 진동 데이터의 특성을 고려하지 않았다. LSTM AutoEncoder에서는 시간 영역에서의 시퀀스 특성을 반영하였지만, 진동 데이터의 주파수 특성을 반영하지는 못했다. 이러한 문제를 해결하기 위해 제안하는 네트워크는 기존 진동 데이터의 대역에서 고대역과 저대역의 특성 추출에 집중할 수 있도록 하는 모델을 제안한다. Fig. 8은 Multi-Column AutoEncoder의 전반전인 이상 탐지 프로세스를 나타낸다.

CPTSCQ_2023_v28n2_9_f0008.png 이미지

Fig. 8. Anomaly Detection Process of Multi-Column AutoEncoder

Multi-Column AutoEncoder의 구조는 진동 데이터의 주파수 특성을 반영하여 대역별로 특성 추출에 집중하고자 한다. 시간 영역에서 주파수 특성을 반영하기 위해서 업샘플링(Up-sampling)과 다운샘플링(Down-sampling)을 통해 주파수 해상도를 고대역과 저대역으로 변환한다.

Fig. 9는 Multi-Column AutoEncoder의 Encoder 구조이다. 크게 고대역, 중대역, 저대역으로 나누어 각 대역에서 특성을 추출하는 병렬구조이다. 입력의 진동 데이터를 압축하는 과정이다. 식 (2)는 이산 푸리에 변환(Discrete Time Fourier Transform, DFT)을 나타내는 식으로 이산 시간에 대한 신호와 이산 주파수 신호 간의 변환을 의미한다. 여기서 N은 시간 샘플 수를 의미하며 N이 높을수록 주파수 영역에서 고주파 대역까지 나타낼 수 있다. 반대로, N이 낮을수록 주파수 영역에서 표현할 수 있는 대역이 제한적이기 때문에 저주파 대역을 나타낸다. Encoder에서 진동 데이터의 입력 샘플 N개를 업샘플링하여 2N개로 증가시켜서 고주파 대역의 해상도를 높인다. 마찬가지로 입력 샘플 N개를 다운샘플링하여 N/2로 감소시켜서 저주파 대역에 집중하고자 한다.

\(\begin{aligned}X(k)=\sum_{n=0}^{N-1} x(n) e^{-j \frac{2 \pi}{N} k n}, 0 \leq k<N\end{aligned}\)(2)

CPTSCQ_2023_v28n2_9_f0009.png 이미지

Fig. 9. Encoder of Multi-Column AutoEncoder

고대역에서 업샘플링은 Transposed Convolution을 통해 확장한다. kernel 크기는 3, channel은 3, stride는 2값을 갖는다. 확장된 입력은 6개의 Dilated Convolution을 지나고 마지막 Convolution을 통해 다시 다운샘플링 된다. 마지막 Convolution의 kernel 크기는 1, channel은 1, stride는 2 값을 갖는다. 중대역에서는 kernel 크기가 3이고 channel이 3인 일반적인 Convolution을 수행하며 샘플값의 변화를 주지 않는다. 이후 6개의 Dilated Convolution을 지나서 kernel 1, channel 1인 Convolution을 통해 특성을 추출한다. 마지막 저대역에서는 kernel 크기가 3이고 channel 3인 stride가 2인 Convolution을 통해 입력 샘플을 축소한 뒤 6개의 Dilated Convolution을 수행한다. 이렇게 얻어진 대역별 Encoder의 출력 결과를 논리합으로 압축하여 특성 벡터로 나타내게 된다.

Fig. 10은 Multi-Column AutoEncoder의 Decoder 구조이다. Encoder의 구조와 대칭 구조를 위해 각 대역에 매칭되는 병렬구조를 갖는다. 분류 성능 향상을 위해서 좋은 특성을 추출하는 것이 관건이기 때문에 상대적으로 Encoder의 역할이 중요하다. 구조적으로 Decoder가 Encoder보다 단순한 구조를 갖고 Decoder의 모든 layer들은 일반적인 Convolution으로 이루어져 있고 kernel size는 3, channel은 8이다. 마지막 layer만 channel 3이며, 논리합을 통해 원래 신호를 출력한다.

CPTSCQ_2023_v28n2_9_f0010.png 이미지

Fig. 10. Decoder of Multi-Column AutoEncoder

Table 1은 반영된 데이터 특성에 따른 모델별 비교이다. 주어진 학습 데이터는 1-dimension의 시퀀스 특성을 가지는 진동 데이터이다. 첫 번째로 Convolutional AutoEncoder는 진동 데이터의 시퀀스 특성과 주파수 특성을 모두 반영하지 못했다. 두 번째로 LSTM AutoEncoder는 LSTM을 사용하여 진동 데이터의 시퀀스 특성을 반영하였지만, 주파수 특성을 반영하지는 못하였다. 마지막으로 Multi-Column AutoEncoder는 진동 데이터의 시퀀스 특성을 반영하지는 못하였지만 입력 데이터 샘플 개수의 확장 및 축소 과정을 통해 주파수 특성을 반영하였다.

Table 1. Comparison model of models by reflected feature

CPTSCQ_2023_v28n2_9_t0001.png 이미지

2. Experiment

2.1 Dataset

성능 평가로 Mendeley Data에서 제공하는 Triaxial Bearing Vibration 데이터셋을 활용하였다[12]. 데이터는 x, y, z 축에 따라 3축 진동 데이터로 구성되어있다. Triaxial Bearing Vibration 데이터셋의 정상 데이터만 학습에 사용하였고 최종 테스트에만 비정상 데이터를 사용하였다. 테스트에 사용된 비정상 데이터로는 1.7mm 내륜 결함 데이터를 사용하였으며 진동 데이터는 10kHz Sampling rate로 채집되었다. 각 인스턴스(instance)는 512개의 샘플로 약 50ms 단위로 추출하여서 정상 비정상을 판단하였다. 데이터 증강은 진동 데이터에 사용되는 방식을 따라 일부 데이터 중첩하는 오버랩(Overlap) 방식을 이용하였다[13]. Fig. 11과 같이 64샘플 단위로 오버랩하여 하나의 샘플 데이터를 얻는 방식을 사용하였다.

CPTSCQ_2023_v28n2_9_f0011.png 이미지

Fig. 11. Data Augmentation using Overlap

Convolutional AutoEncoder에서는 입력은 512 × 3으로 1,536개의 샘플이고 Encoder를 통과하면 8 × 64인 512개 샘플로 압축된다. LSTM AutoEncoder에서 입력은 동일하고 Encoder를 통과하면 512 × 1인 512개 샘플로 압축된다. Multi-Column AutoEncoder에서 입력과 Encoder를 통과한 샘플 값 역시 LSTM AutoEncoder와 동일하다. 동일한 조건에서 OC-SVM으로 분류하기 위해 잠재 영역(Latent Space)에서 압축된 데이터 특성의 정보량을 512개로 모두 동일하게 설정하였다.

Fig. 12와 같이 실험에서의 데이터셋 구성을 3가지로 나누었다. 첫 번째는 AutoEncoder 계열의 특성 추출 모델을 학습하기 위한 정상 데이터로 이루어진 1,819개의 데이터 집합이다. 두 번째는 학습된 AutoEncoder 계열의 특성 추출 모델에서 Encoder를 통과해 OC-SVM의 학습과 평가를 위한 1,845개의 정상 데이터의 집합이다. 마지막은 학습된 OC-SVM을 평가하기 위한 100개의 비정상 데이터들의 집합이다.

CPTSCQ_2023_v28n2_9_f0012.png 이미지

Fig. 12. Data Flow Diagram within a Process

2.2 Setup

특성 추출을 위한 AutoEncoder 계열의 네트워크 학습과정에서 가중치는 Glorot uniform으로 초기화하였고, Adam 최적화를 사용하였으며, mini-batch size는 16,learning rate는 0.005로 설정하였다[14][15]. 학습에서의 과적합을 막기 위해 early stopping을 사용하였고 epochs는 500, early stopping의 patience는 30으로 설정하였다[16]. 모델 학습에 필요한 정상 데이터의 8:2 비율로 모델 훈련(training), 모델 검증(validation)으로 나누었다. 손실 함수로는 평균 제곱 오차(Mean Squared Error, MSE), 데이터 스케일링은 MinMax Scaler를 사용하였다. 실험 환경으로 GPU는 NVIDIA Tesla T4를 이용하였으며 Tensorflow는 2.9.2 버전을 사용하였다.

2.3 Performance

Table 2은 각각의 네트워크별로 진동 데이터의 특성을 추출한 뒤 OC-SVM을 통해 정상과 비정상을 분류한 결과를 혼동 행렬(Confusion Matrix)로 나타냈다. 비정상 데이터를 모두 제대로 분류하였으니 정상 데이터의 분류 성능에서 차이가 나는 것을 확인할 수 있다. Convolutional AutoEncoder에서 정상 데이터 중 58개는 정 분류, 42개는 오 분류 하였다. 진동 데이터의 시퀀스 특징을 반영한 LSTM AutoEncoder에서 정상 데이터 중 77개는 정 분류, 23개는 오 분류 하였다. 마지막으로 진동 데이터의 주파수 특성을 고려한 Multi-Column AutoEncoder에서 정상 데이터 중 82개는 정 분류, 18개는 오 분류 하였다.

Table 2. Confusion Matrix by Network

CPTSCQ_2023_v28n2_9_t0002.png 이미지

Table 3는 분류 결과를 수치화한 성능 평가표이다. 평가지표로 accuracy, precision, recall, f1-score로 4가지를 사용하였다. accuracy는 Convolutional AutoEncoder에서 0.790으로 가장 낮았고 Multi-Column AutoEncoder에서 0.910으로 가장 높았다. precision은 모두 1.0으로 동일한 성능을 나타냈으며, recall에서는 Convolutional AutoEncoder에서 0.580으로 가장 낮고 Multi-Column AutoEncoder에서 0.820으로 가장 높았다. f1-score는 Convolutional AutoEncoder에서 0.734로 가장 낮았고 Multi-Column AutoEncoder에서 0.901로 가장 높았다. 전반적으로 Multi-Column AutoEncoder, LSTM AutoEncoder, Convolutional AutoEncoder 순서로 높은 성능을 보여주고 있다.

Table 3. Performance by Network

CPTSCQ_2023_v28n2_9_t0003.png 이미지

Fig. 13은 각 네트워크의 민감도와 특이도를 이용하여 ROC(Receiver Operator Characteristic) 곡선이다. Convolutional AutoEncoder의 면적이 가장 좁은 것으로 보아 낮은 분류 성능을 확인할 수 있고, Multi-Column AutoEncoder의 면적이 가장 넓은 것으로 보아 우수한 분류 성능을 확인할 수 있다.

CPTSCQ_2023_v28n2_9_f0013.png 이미지

Fig. 13. ROC Graph by Model

IV. Conclusions

본 논문은 베어링 진동 이상 탐지에서 진동 데이터 특성 추출을 위한 기술을 제안하였다. 비정상 데이터 채집이 어려운 환경을 고려하여 정상 데이터만 학습에 사용하는 단일 클래스 분류 방법을 이용해 결함 진단을 실시하였다. 진동 데이터의 주파수 특성을 반영하기 위해 대역별 주파수 특성 추출에 집중할 수 있도록 네트워크를 제안하였다. 제안하는 방법에 따라 분류한 결과가 accuracy, precision, recall, f1 score의 평가 지표에서 가장 높은 분류 성능을 확인할 수 있었다. 이는, 주파수 특성을 고려한 네트워크 구조가 진동 이상 탐지에서 성능적으로 유의미한 결과를 확인할 수 있었다.

진동 데이터의 특성 추출을 위한 모델링에 대한 연구는 잘 이루어졌으나 분류기의 연구는 아직 제대로 이루어지지 않았으며 성능 향상의 여지가 많다. 추후 특성에 따른 분류 모델에 관한 연구를 진행할 예정이다.

References

C.-S. Lee, J.-W. Park, S.-Y. Lim, and B.-S. Kang, "A Study on the Life Characteristics of Lightweight Bearings," Journal of the Korean Society of Industry Convergence, Vol. 24, No. 6, pp. 819-825, Dec 2021. DOI:https://doi.org/10.21289/KSIC.2021.24.6.819
J. H. Lee, S.-Y. Yoo, S. Shin, D.-H. Kang, S. Lee, and J. C. Lee, "Fault diagnosis of bearings using machine learning algorithm," Journal of the Korean Society of Marine Engineering, Vol. 43, No. 6. pp. 455-462, Jul 2019. DOI:10.5916/jkosme.2019.43.6.455.
J.-S. Lee, T.-M. Yoon, and K.-B. Lee, "Bearing Fault Detection of IPMSMs using Zoom FFT," Journal of Electrical Engineering and Technology, Vol. 11, No. 5, pp. 1235-1241, Sep 2016. https://doi.org/10.5370/JEET.2016.11.5.1235
B.-S. Kim, W.-C. Kim, D.-S. Gu, J.-G. Kim, and B.-K. Choi, "Low Speed Rolling Bearing Fault Detection Using AE Signal Analyzed By Envelop Analysis Added DWT," Journal of the Korean Society of Marine Engineering, Vol. 33, No. 5, pp. 672-678, Jul 2009. DOI: 10.5916/jkosme.2009.33.5.672
SeungChul Lee, Juhyeong Jeon, Sooyoung Lee, Kangsan Lee, Hyunsuk Huh, Taegyu Choi, and Jungchan Kim, "Deep Learning-based Anomaly Detection of Bearing Faults," Proceedings of the Korean Society for Noise and Vibration Engineering Conference, pp. 86-86, Oct 2019.
Yechan Jeon, Yonghyun Lee, and Dong-Ju Kim, "Development of Rotating Equipment Anomaly Detection Algorithm based-on Artificial Intelligence" Proceedings of the Korean Society of Computer Information Conference, pp 57-60, Jul 2021.
Perera, Pramuditha, Poojan Oza, and Vishal M. Patel. "One-class classification: A survey," arXiv preprint arXiv:2101.03064, 2021. DOI:https://doi.org/10.48550/arXiv.2101.03064
Hejazi, Maryamsadat, and Yashwant Prasad Singh, "One-class support vector machines approach to anomaly detection," Applied Artificial Intelligence, pp 351-366, May 2013. DOI:https://doi.org/10.1080/08839514.2013.785791
Fujita, Kohki, Shingo Mabu, and Takashi Kuremoto. "Anomaly Detection of Disaster Areas from Satellite Images Using Convolutional Autoencoder and One-class SVM," ICAROB2018, Feb 2018. DOI:10.5954/ICAROB.2018.GS4-4
Said Elsayed, M., Le-Khac, N. A., Dev, S., & Jurcut, A. D, "Network anomaly detection using LSTM based autoencoder," Proceedings of the 16th ACM Symposium on QoS and Security for Wireless and Mobile Networks, pp. 37-45, Nov 2020. DOI:https://doi.org/10.1145/3416013.3426457
He Yangdong, and Jiabao Zhao, "Temporal convolutional networks for anomaly detection in time series," Journal of Physics: Conference Series, Vol. 1213, No. 4, 2019. DOI:10.1088/1742-6596/1213/4/042050
Kumar Dileep, Mehran Sanaullah, Shaikh Muhammad Zakir, Hussain Majid, Chowdhry Bhawani Shankar, and Hussain Tanweer, "Triaxial Bearing Vibration Dataset of Induction Motor under Varying Load Conditions," Mendeley Data, Jun 2022. DOI:10.17632/fm6xzxnf36.2
Song, Xudong, et al. "A bearing fault diagnosis model based on CNN with wide convolution kernels," Journal of Ambient Intelligence and Humanized Computing 13.8, pp. 4041-4056, 2022. DOI:https://doi.org/10.1007/s12652-021-03177-x
Glorot, Xavier, and Yoshua Bengio, "Understanding the difficulty of training deep feedforward neural networks," Proceedings of the thirteenth international conference on artificial intelligence and statistics, JMLR Workshop and Conference Proceedings, 2010.
D. P. Kingma and J. Ba, "Adam: a method for stochastic optimization," ICLR, 2015. DOI:https://doi.org/10.48550/arXiv.1412.6980
Yao, Yuan, Lorenzo Rosasco, and Andrea Caponnetto, "On early stopping in gradient descent learning," Constructive Approximation26.2, pp 289-315, 2007.

Journal of the Korea Society of Computer and Information (한국컴퓨터정보학회논문지)

Vibration Anomaly Detection of One-Class Classification using Multi-Column AutoEncoder

Abstract

Keywords

I. Introduction

II. Preliminaries

1. Feature extraction

1.1 Convolutional AutoEncoder

1.2 LSTM AutoEncoder

2. Classifier

2.1 One Class SVM

III. The Proposed Scheme

1. Proposed Model

1.1 Dilated Convolution

1.2 Multi-Column AutoEncoder

2. Experiment

2.1 Dataset

2.2 Setup

2.3 Performance

IV. Conclusions

References

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)