DOI QR코드

DOI QR Code

유전 프로그래밍을 활용한 제조 빅데이터 분석 방법 연구

Genetic Programming based Manufacutring Big Data Analytics

  • 오상헌 (한국 방송 통신 대학교 바이오-정보통계학과 대학원) ;
  • 안창욱 (광주과학기술원(GIST) AI대학원)
  • 투고 : 2020.05.27
  • 심사 : 2020.07.04
  • 발행 : 2020.09.30

초록

현재 제조 분야 빅데이터 분석을 위하여 black-box 기반 기계 학습 알고리즘을 활용하고 있다. 해당 알고리즘은 높은 분석 정합성 가지는 장점이 있지만, 분석 결과에 대한 해석이 어렵다는 단점이 있다. 그러나 제조업에서는 분석 알고리즘은 제조 공정 원리 기반 해석을 통하여 결과의 근거 및 도출 타당성에 대한 검증이 중요하다. 이러한 기계 학습 알고리즘의 결과 설명력 한계를 극복하기 위하여 유전 프로그래밍을 활용한 제조 빅데이터 분석 방법을 제안한다. 본 알고리즘은 생물학적 진화유전 프로그래밍 알고리즘은 생물학적 진화를 모방한 진화 연산 (선택, 교배, 돌연변이) 반복하면서 최적의 해를 찾아간다. 그리고 해는 수학적 기호를 활용하여 변수 간의 관계로 나타나며, 가장 높은 설명력을 가지는 해가 최종적으로 선택된다. 이를 통하여 입력 및 출력 변수 관계 수식화를 통한 결과를 도출하므로 직관적인 제조 매카니즘에 대한 해석이 가능하며 또한 수식으로 나타낸 변수간의 관계 기반으로 기존 해석이 불가한 제조 원리 도출도 가능하다. 제안 기법은 대표적인 기계 학습 알고리즘과 성능을 비교 분석 결과 동등 또는 우수한 성능을 보였다. 향후 해당 기법을 통하여 다양한 제조 분야 활용 가능성을 검증하였다.

Currently, black-box-based machine learning algorithms are used to analyze big data in manufacturing. This algorithm has the advantage of having high analytical consistency, but has the disadvantage that it is difficult to interpret the analysis results. However, in the manufacturing industry, it is important to verify the basis of the results and the validity of deriving the analysis algorithms through analysis based on the manufacturing process principle. To overcome the limitation of explanatory power as a result of this machine learning algorithm, we propose a manufacturing big data analysis method using genetic programming. This algorithm is one of well-known evolutionary algorithms, which repeats evolutionary operators such as selection, crossover, mutation that mimic biological evolution to find the optimal solution. Then, the solution is expressed as a relationship between variables using mathematical symbols, and the solution with the highest explanatory power is finally selected. Through this, input and output variable relations are derived to formulate the results, so it is possible to interpret the intuitive manufacturing mechanism, and it is also possible to derive manufacturing principles that cannot be interpreted based on the relationship between variables represented by formulas. The proposed technique showed equal or superior performance as a result of comparing and analyzing performance with a typical machine learning algorithm. In the future, the possibility of using various manufacturing fields was verified through the technique.

키워드

참고문헌

  1. 이훈혜, "제조업 경쟁력 강화를 위한 빅데이터 활용방안," 산업연구원, 2013년 12월
  2. 곽기호, 이하목, "제조업 빅데이터 활용 동향 분석과 시사점," 주간기술동향, 제1762호, 2016년 9월
  3. 과기부처합동, "데이터.AI경제 활성화 계획," 과학기술정보통신부, 2019년 1월
  4. A. Hashmi, and T. Ahmad, "Big data mining: Tools & algorithms," International Journal of Recent Contributions from Engineering, vol. 4, no. 1, pp. 36-40, Oct. 2016.
  5. D. Dua, and C. Graff, UCI Machine Learning Repository Irvine, CA: University of California, School of Information and Computer Science(2019). http://archive.ics.uci.edu/ml (accessed July 8, 2020).
  6. K. Arun, and L. Jabasheela, "Big Data: Review, Classification and Analysis Survey," International Journal of Innovative Research in Information Security, vol. 1, no. 3, pp. 17-23, Sept. 2014.
  7. B. David, R.B. David, and R.M. Ralph, "An Overview of Genetic Algorithms: Part 1, Fundamentals," University Computing, vol. 15, no. 2, pp.58-69, 1993.
  8. B. L. William, "Genetic Programming + Data Structures = Automatic Programming," Kluwer Academic Publishers, 1998.
  9. Tom Mitchell, "Machine Learning," McGRAW-HILL International Editions, Computer Science Series, 1997.
  10. W. Banzhaf, P. Nordin, R.E. Keller, and F.D. Francone, "Genetic Programming: An Introduction on the Automatic Evolution of Computer Programs and Its Applications," Morgan Kaufmann Publishers, Inc. San Francisco, California, July 1997.
  11. C. W. Ahn., "Advances in Evolutionary Algorithms : Theory," Design and Practice. Berlin, Germany: Springer, 2006.
  12. P. A. Whigham, "Inductive bias and genetic programming," First International Conference on Genetic Algorithms in Engineering Systems : Innovations and Applications, Sheffield, UK, pp. 461-466, Oct. 1995.
  13. I. H. Witten and E. Frank, "Data Mining: Practical Machine Learning Tools and Techniques," San Francisco, CA, USA: Morgan Kaufmann Publishers, 2005.
  14. 손민규, "데이터 분석을 떠받치는 수학 : 통계로 배우는 데이터 과학의 기술," 2010년 6월
  15. 오정원, 김행곤, 김일태, "머신러닝 적용 과일 수학시기 예측시스템 설계 및 구현," 스마트미디어저널, 제8권, 제1호, 74-81쪽, 2019년 3월 https://doi.org/10.30693/smj.2019.8.1.74
  16. 박동주, 김병우, 정연선, 안창욱, "Deep Neural Network 기반 프로야수 일일 관중 수 예측: 광주-기아 챔피언스 필드를 중심으로," 스마트미디어저널, 제7권, 제1호, 16-23쪽, 2018년 3월 https://doi.org/10.30693/SMJ.2018.7.1.16