이상진단 성능에 미치는 변수선택과 추정방법의 영향

Effect of Different Variable Selection and Estimation Methods on Performance of Fault Diagnosis

  • 조현우 (대구대학교 신소재에너지공학과)
  • Cho, Hyun-Woo (Department of Materials-Energy Science and Engineering, Daegu University)
  • 투고 : 2019.04.29
  • 심사 : 2019.09.06
  • 발행 : 2019.09.30


생산 공정에서 발생하는 비정상적인 이상 (fault)의 진단 (diagnosis)은 고품질의 제품을 생산함에 있어 필수적이라 할 수 있다. 회분식 공정 (batch process)과 같이 부가가치가 큰 반도체나 의약품 등의 첨단 제품을 생산하는 공정에서는 더욱 실시간 진단의 역할이 커지고 있다. 본 연구에서는 회분식 공정으로부터 얻은 측정 데이터와 비선형 분류(nonlinear classification)에 기초한 실시간 이상 진단 체계에 있어서 변수선택과 미래값 추정 기법이 진단 성능에 미치는 영향을 평가한다. 공정 변수 중 진단에 필수적이며 기여도가 높은 변수만을 선택하여 진단 모델 (diagnosis model)을 구성함으로써 진단 성능의 향상을 기대할 수 있다. 본 연구에서는 여러 변수선택 (variable selection) 기법들의 진단 성능을 비교 평가한다. 또한, 현재 진행 중인 회분식 조업 데이터는 종료되기 이전에는 진단에 필요한 전체 데이터를 얻을 수 없으므로 현재 시점에서 측정되지 못한 미래 측정값 (future observations)이 추정되어야 한다. 미래값 추정방법들의 선택이 변수선택과 분류기반 진단 관점에서 진단 성능에 어떻게 영향을 주는지 평가한다. 폴리염화비닐 회분식 공정에 대한 사례 연구를 수행하여 최적의 변수선택과 미래값 추정방법을 도출하였다. 변수선택 방법에 따라 최대 21.9%와 13.3%의 성능 향상을 보였으며 미래값 추정방법에 따라서는 최대 25.8%와 15.2% 향상됨을 알 수 있었다.

Diagnosis of abnormal faults is essential for producing high quality products. The role of real-time diagnosis is quite increasing in the batch processes of producing high value-added products such as semiconductors, pharmaceuticals, and so forth. In this study, we evaluate the effect of variable selection and future-value estimation techniques on the performance of the diagnosis system, which is based on nonlinear classification and measurement data. The diagnostic performance can be improved by selecting only the variables that are important and have high contribution for diagnosis. Thus, the diagnostic performance of several variable selection techniques is compared and evaluated. In addition, missing data of a new batch, called future observations, should be estimated because the full data of a new batch is not available before the end of the cycle. In this work the use of different estimation techniques is analyzed. A case study on the polyvinyl chloride batch process was carried out so that optimal variable selection and estimation methods were obtained: maximum 21.9% and 13.3% improvement by variable selection and maximum 25.8% and 15.2% improvement by estimation methods.



  1. Z. Ge, "Process data analytics via probabilistic latent variable models: a tutorial review", Industrial and Engineering Chemistry Research, Vol.57, No.38, pp.12646-12661, 2018. DOI:
  2. K. Tidriri, N. Chatti, S. Verron, T. Tiplica, "Bridging data-driven and model-based approaches for process fault diagnosis and health monitoring: A review of researches and future challenges", Annual Reviews in Control, Vol.42, pp.63-81, 2016. DOI:
  3. H. Rostami, J. Blue, C. Yugma, "Automatic equipment fault fingerprint extraction for the fault diagnostic on the batch process data", Applied Soft Computing, Vol.68, pp.972-989, 2018. DOI:
  4. S. Bersimis, S. Psarakis, J. Panaretos, "Multivariate Statistical Process Control Charts: An Overview", Quality and Reliability Engineering International, Vol.23, pp.517-543, 2007. DOI:
  5. H. Cho, K. Kim, "A method for predicting future observations in the monitoring of a batch process", Journal of Quality Technology, Vol.35, pp.59-69, 2003. DOI:
  6. I. Guyon, J. Weston, S. Barnhill, V. Vapnik, "Gene selection for cancer classification using support vector machines", Machine Learning, Vol.46, pp.389-422, 2002. DOI:
  7. S. Wold, H. Antti, F. Lindgren, J. Ohman, "Orthogonal signal correction of near-infrared spectra", Chemometrics and Intelligent Laboratory Systems, Vo.44, pp.175-185, 1998. DOI: