DOI QR코드

DOI QR Code

A Study on Optimization of Perovskite Solar Cell Light Absorption Layer Thin Film Based on Machine Learning

머신러닝 기반 페로브스카이트 태양전지 광흡수층 박막 최적화를 위한 연구

  • Received : 2022.04.20
  • Accepted : 2022.05.09
  • Published : 2022.07.28

Abstract

The perovskite solar cell is an active part of research in renewable energy fields such as solar energy, wind, hydroelectric power, marine energy, bioenergy, and hydrogen energy to replace fossil fuels such as oil, coal, and natural gas, which will gradually disappear as power demand increases due to the increase in use of the Internet of Things and Virtual environments due to the 4th industrial revolution. The perovskite solar cell is a solar cell device using an organic-inorganic hybrid material having a perovskite structure, and has advantages of replacing existing silicon solar cells with high efficiency, low cost solutions, and low temperature processes. In order to optimize the light absorption layer thin film predicted by the existing empirical method, reliability must be verified through device characteristics evaluation. However, since it costs a lot to evaluate the characteristics of the light-absorbing layer thin film device, the number of tests is limited. In order to solve this problem, the development and applicability of a clear and valid model using machine learning or artificial intelligence model as an auxiliary means for optimizing the light absorption layer thin film are considered infinite. In this study, to estimate the light absorption layer thin-film optimization of perovskite solar cells, the regression models of the support vector machine's linear kernel, R.B.F kernel, polynomial kernel, and sigmoid kernel were compared to verify the accuracy difference for each kernel function.

페로브스카이트 태양전지는 4차 산업혁명으로 사물인터넷, 가상환경 등의 증가에 따른 전력 수요가 급증하면서 점진적으로 고갈되어가는 석유, 석탄, 천연가스 등의 화석연료를 대체할 태양에너지, 풍력, 수력, 해양에너지, 바이오에너지, 수소에너지 등의 신재생 에너지 분야에서 연구가 활발한 부분이다. 페로브스카이트 태양전지는 페로브스카이트 구조를 가진 유-무기 하이브리드 물질을 사용하는 태양전지 소자로 고효율, 저가의 용액 및 저온 공정으로 기존의 실리콘 태양전지를 대체할 수 있는 장점들이 있다. 기존의 경험적 방법으로 예측한 광흡수층 박막을 최적화하기 위해서 소자 특성 평가를 통해 신뢰도를 검증해야 한다. 그러나 광흡수층 박막 소자 특성 평가 비용이 많이 소요되므로 시험 횟수에 제약이 따른다. 이러한 문제점을 해결하기 위하여 광흡수층 박막 최적화의 보조 수단으로 머신러닝이나 인공지능 모델을 이용하여 명확하고 타당한 모델의 개발과 적용 가능성이 무한하다고 본다. 이 연구에서는 페로브스카이트 태양전지의 광 흡수층 박막 최적화를 추정하기 위하여 서포트 벡터 머신의 선형 커널, 가우시안 커널, 비선형 다항식 커널, 시그모이드 커널의 회귀분석 모델을 비교하여 커널 함수별 정확도 차이를 검증하였다.

Keywords

l. 서 론

현재 글로벌하게 석유, 석탄 및 천연가스 등의 화석연료의 에너지 고갈 문제가 심각해지는 문제점을 해결하기 위해 신재생 에너지에 대한 관심이 증가하는 추세로 [그림 1]의 산업통상 자원부의 제9차 전력 수급 기본 계획의 전원별 설비 용량 비중을 살펴보면 원전과화석연료의 비중이 대폭 감소하는 것에 비해 신재생 에너지의 비중이 대폭 증가하는 것을 볼 수 있다.

그림1. 제9차 전력수급기본계획[1]

새로운 재생 에너지원으로 태양 에너지원, 풍력, 수 력, 해양에너지, 바이오에너지, 수소에너지 등을 이용한다양한 방법들이 연구되고 있는 가운데 태양에너지에서 태양광을 이용하여 빛에너지를 전기에너지로 변환시키는 부분에 대하여 가장 많이 사용하고 있으며, 태양전지는 소재에 따라 무기(Inorganic) 태양전지, 유기 (Organic) 태양전지, 유-무기 하이브리드(Organic- Inorganic) 태양전지로 분류되고 있다[2].

페로브스카이트 태양전지는 기존의 실리콘 태양전지를 대체하는 차세대 태양전지로 페로브스카이트 구조를 가진 유-무기 하이브리드 물질을 광 활성층으로 사용하는 태양전지 소자로 2009년 Tsutomu Miyasaka 교수가 MaPbI3 페로브스카이트 물질을 최초로 사용하 였고[3]. 2014년 한국화학연구원 팀이 스핀 코팅 방법을 이용한 모듈 제작을 보고하였으며[4]. 2015년 경희대 임상혁 교수 연구팀은 p-i-n 소자 구조를 갖는 페로브스카이트 모듈 제작하는[5] 등 차세대 태양전지로써빠른 성장을 하고 있다.

페로브스카이트 태양전지와 관련된 기존 연구로 국내,외 1,631건의 논문을 검색해 본 결과 많은 연구기관에서 모듈 크기에 대한 연구를 진행한 결과는 있으나

[16[17], 빅데이터를 기반으로 분석한 박막 코팅 최적화 모델을 이용한 연구는 찾을 수가 없어 머신러닝 모델을 이용하여 2,252건의 데이터를 분석하였다.

머신러닝은 특정 목적을 위해 입력된 데이터 세트를바탕으로 학습을 진행하여 시스템을 형성하고 개선해나가는 프로세스로 정의할 수 있고, 학습 데이터 세트의 특성에 따라 입력되는 데이터 세트에 목표로 하는값을 포함하여 학습하는 지도 학습과 목표로 하는 값을학습하지 않고 데이터 세트의 분포에 기반을 두어 군집을 만들거나 특징을 추출하는 비지도 학습으로 분류된 다[6]. 지도 학습은 입력 데이터를 목표값에 매핑(mapping)하여 대상 데이터의 경향과 분포에 대한 학습을 수행하고 예측 시스템을 구축하며, 사용하는 목표값의 유형에 따라 다시 분류와 회귀로 나뉜다. 비지도학습은 목표 데이터가 학습 데이터에 포함되지 않는 방 법으로, 입력 데이터를 이용하여 군집을 만들거나 데이터의 분포 또는 특성에 따라 관계를 분석하는 방식으로학습을 한다[7]. 일반적인 회귀분석은 다중회귀를 사용하여 종속변수와 하나 이상의 독립변수 사이에서 유의미한 관계의 존재 여부와 여러 변수가 종속변수에 미치는 영향도를 추정하지만, 서포트 벡터 머신 회귀 (Support Vector Machine Regression, SVR)는 추가적으로 손실 함수를 도입하여 실제값과 추정값 차이를 작게 하여 예측 성능이 우수한 장점이 있다.

따라서 본 논문에서는 페로브스카이트 태양전지의광흡수층 박막에 영향을 미치는 bed 온도, coating speed, N2 blowing 간격, N2 blowing 높이, N2 blowing 세기 등의 변수를 가지고 머신러닝의 지도 학습기반 서포트 벡터 머신 회귀(SVR)의 데이터를 반환하지 않는 선형(linear) 커널, 데이터를 비선형 변환에추가하는 비선형 다항식(polynomial) 커널, 다양한 형태에 적용하는 가우시안(R.B.F, Radial Basis Function) 커널, 시그모이드 함수를 사용하여 신경망과 조금 유사한 시그모이드(sigmoid) 커널 함수별 정확도 차이를 검증하고자 한다[8].

연구 방법

1. 데이터 수집 및 전처리

본 논문에서 사용한 원본 데이터는 2019년 8월부터2022년 3월까지 한양 솔라에너지에서 [그림 2]의 3D Slot-die 방법으로 실험한 데이터 즉 속성이 coating speed(SPD), N2 blowing 간격(DIST), N2 blowing 세기(BAR), N2 blowing 높이(HG), bed 온도(TMP)에따른 코팅 두께(THK)를 수집한 후, 전문가와 협의하여이상치나 결측값을 전처리하여 2,252건의 데이터를획 득하였고, 파생 변수를 포함한 데이터 속성들의 설명은[표 1]과 같다.

그림2. 3D slot-die coating method

표1. Summary of Investigated Data

각각의 독립변수 범위는 SPD가 172 ~ 188mm/min, DIST가 22 ~ 28mm, BAR가 1.2 ~ 1.8bar, HG가 8 ~ 12mm, TMP가 56 ~ 64C이고, 독립변수의 변화에 따른 종속변수 THK는 472 ~ 628nm로 측정되 었다. 이러한 원시 데이터를 사용할 경우 회귀분석에서결정한 기울기로부터 속성이 미치는 영향을 균등하게평가할 수 없다고 판단하여 데이터를 최소값 0, 최대값 1. 그리고 다른 값들은 0과 1 사이의 값으로 변환하여

각각의 속성들이 기울기에 미치는 영향을 균등하게 평가할 수 있게 정규화를 하였다[9]. 그리고 실험에서 생성한 5개의 파생 변수 RST_THK, XRD, UV_t, UV_a, UV_lev는 type이 logical과 factor로 회귀분석에 적합하지 않아 제외하였고, 주요 변수들에 대한 기술 통계량은 [표 2]와 같고 상관관계는 [그림 3]과 같다.

표2. Statistical Quantities for data

그림3. Correlation by feature

2.2 서포트 벡터 회귀(SVR)

서포트 벡터 머신(Support Vector Machine)은 분류(Classification)와 예측(Regression)에 응용할 수있는 알고리즘으로 크게 분류를 위한 서포트 벡터 분류 (Support Vector Classification, SVC)와 예측을위

한 서포트 벡터 회귀(Support Vector Regression, SVR)로 나뉜다[10]. 기본적으로 서포트 벡터 분류는 다차원으로 구성된 데이터의 입력공간에 마진을 최대화하는 초평면(Hyperplane)을 구하고, 이 초평면을 결정함수로 사용하여 미지의 데이터가 어떤 그룹에 속할지를 예측하고, 서포트 벡터 회귀는 실제값과 예측값의차이가 E 이내인 것은 벌점이 없고, 그 이상의 오차는벌점으로 하는 손실 함수라는 것을 사용하며 아래와같 다.

\(L ( u ) = \left[ \begin{array} { c } { 0 , - \epsilon \leq u \leq \epsilon } \\ { u - \epsilon , u > \epsilon } \\ { - u - \epsilon , u \leftarrow \epsilon } \end{array} \right]\)

그림 4. Support Vector Regression

2.3 서포트 벡터 회귀(SVR) 모델 예측

태양전지 광흡수층 박막 최적화의 독립변수는 coating speed(SPD), N2 blowing 간격(DIST), N2 blowing 세기(BAR), N2 blowing 높이(HG), bed 온 도(TMP)를 설정하였고, 종속변수는 박막 두께(THK)를 설정하였다. 서포트 벡터 회귀(SVR) 모델 학습을 위해 70%의 데이터를 훈련 셋(training set)으로 이용하여 예측 모델을 학습하였고, 나머지 30%의 데이터는 테스 트셋(test set)으로 구성하여 학습된 모델을 검증하기 위하여 사용하였으며, 각 커널 함수와 파라미터는 [표 3]과 같다.

표3. Description for used Kernels

회귀 모델 예측의 정확도를 측정하기 위해 사용한 지 표는 큰 차이의 오차에 대하여 패널티를 적용하여 민감 도를 줄인 평균 제곱근 오차 (Root Mean Squared Error, RMSE)와 실제 값과 동일한 단위를 적용하기에 직관적으로 모델 성능 비교를 쉽게 할 수 있는 평균절 대 오차(Mean Absolute Error, MAE), 그리고 모델이 학습 데이터에 얼마나 적합한지를 평가하는 결정계수( R-squared, R2)이다. 지표의 값이 0에 근사할수록 추 정 모델의 설명력이 좋은 평균 제곱근 오차 (RMSE)와 평균 절대 오차(MAE), 1에 가까울수록 추정 모델의 설 명력이 좋은 결정계수(R)는 식(1) ~ 식 (3)과 같이 계 산 된다[12].

오차를 허용할 수 있는 범위인 cost, 하나의 데이터샘플이 영향력을 행사하고 거리를 결정하는 gamma, 초평면의 폭을 결정하는 epsilon, 비선형 다항식 커널에서만 사용하는 다항식 커널 함수의 각도 degree 파라미터의 option을 지정하지 않을 때 기본값들은 표4]와 같다.

\(= \sqrt { \frac { 1 } { n } \sum _ { 1 } ^ { n } ( y _ { i } - \hat { y } _ { i } ) ^ { 2 } }\)

\(= \frac { 1 } { n } \sum _ { i } ^ { n } | y _ { i } - \hat { y } _ { i } |\)

\(R ^ { 2 } = 1 - \frac { \sum _ { 1 } ^ { n } ( y _ { i } - \hat { y } _ { i } ) ^ { 2 } } { \sum _ { 1 } ^ { n } ( y _ { i } - \overline { y _ { i } } ) ^ { 2 } }\)

기본 파라미터 값을 적용한 그래프를 살펴보면 선형 (linear) 커널과 가우시안(R.B.F, Radial Basis Function)커널은 [그림 5]와 같이 오차가 작은 선형으로 보이고, 비선형 다항식(polynomial) 커널과 시그모 이드(sigmoid) 커널은 [그림 6]과 같이 오차가 있는 선형으로 보임을 알 수 있다.

그림5. plot of linear and R.B.F

그림 6. plot of polynomial and sigmoid

2.4 서포트 벡터 회귀(SVR) 성능 평가

[표 4]와 같이 기본적으로 제공하는 파라미터 기준으로 커널 함수별 정확도 차이를 결정하기 어려워 최적의초평면을 찾기 위해 선형 커널 파라미터는 cost를 0.1, 1, 10 )으로, gamma를 (0.02, 0.2, 2 )로, epsilon을 (0.01, 0.1, 1)을 사용하고, 비선형 다항식커널 파라미터는 cost를 (1,5, 10)으로 degree는 1. 3, 10)으로 gamma는 (0.2, 2, 5)로 epsilon은 (0.01, 0.1.1)을 사용하고, 가우시안 커널 파라미터는cost를 (0.1, 1. 10 )으로, gamma를 (0.02, 0.2, 2 )로, epsilon을 (0.01, 0.1, 1 )을 사용하고, 시그모이드 커널 파라미터는 cost를 (0.1, 1, 10 )으로, gamma를 (0.02, 0.2, 2)로, epsilon을 (0.01, 0.1, 1 )을 사용하여 각 커널별 파라미터에 변화를 주었고, 샘플링 방법으로 10-fold cross validation을 이용한파라미터의 튜닝 결과는 [표 6]과 같다.

표 6. Best parameters

기본 파라미터 값과 튜닝된 파라미터 값을 비교해 보 면 오차를 허용할 수 있는 범위인 cost는 커지고, 데이 터 샘플의 영향력을 행사하고 거리를 결정하는 gamma와 초평면의 폭을 결정하는 epsilon은 적어지 는 것을 파악할 수 있다.

튜닝된 파라미터 값을 각 커널에 입력하여 커널 함수 별 정확도 차이를 비교한 결과 [표 7]과 같이 RMSE는 0.00964로 가우시안 커널이 가장 적었고, MAE는 0.00271로 시그모이드 커널이 가장 적었으며, 결정계 수R2는 가우시안 커널이 0.99733로 가장 좋았다. 그 리고 결정계수 R2는 4가지 커널 모두 0.997 이상으로 회귀식의 적합도가 높은 것을 파악할 수 있다.

튜닝된 파라미터 값을 적용한 그래프를 살펴보면 선형 커널과 가우시안 커널은 [그림 7]과 같이 기본 파라미터를 적용한 그래프와 비슷하게 오차가 작은 선형으로 보이고, 비선형 다항식 커널과 시그모이드 커널은[그림 8]과 같이 오차가 많이 개선된 선형으로 나타남을알 수 있다.

표7. Tuned results of RMSE, MAE, R2

그림7. Tuned plot of linear and R.B.F

그림 8. Tuned plot of polynomial and sigmoid

결 론 및 시사점

미래 세계 전력 시스템에 대한 장기 분석 보고서인 'NEO 2018'에서 '50년까지 태양광과 풍력이 전 세계 발전량의 50%수준까지 급증할 것으로 전망하였고[13], 산업부의 '재생에너지 3020 이행계획(2017)'과 과기정 통부(과학기술혁신본부)의 '2019년도 정부 연구개발 투자 방향 및 기준(2018)*의 내용을 보면 기후변화 대 응, 청정에너지 기술 및 에너지 신산업 창출 등에 대한 연구개발 지원을 위해 광활성 소재의 특성으로 인해가 볍고 유연하며 투과성이 있고, 저가이면서 Nee 이고, 제작할 때 용액 공정 적용이 가능한 페로브스카 이트 태양전지를 차세대 새로운 재생에너지 핵심 기술 중 하나로 개발 계획에 포함한 것을 알 수 있다 [14-16].

따라서 본 연구는 새로운 재생에너지 중 하나인 페로 브스카이트 태양전지의 광 흡수층 박막 최적화를 추정 하기 위하여 서포트 벡터 머신의 선형 커널, 가우시안 커널, 비선형 다항식 커널, 시그모이드 커널의 회귀분석 모델로 추정 정확도를 비교하여 커널 함수별 다음과 같 은 요약할 수 있다.

1. 추정의 정확도를 검토한 결과 4가지 커널 중 파라 미터를 튜닝 전[표 5], 튜닝 후[표 7] 가우시안 커널을 사용한 경우가 가장 좋은 결과를 보여주었다. 특히가 우시안 커널은 파라미터를 튜닝하여 적용한 경우에도 RMSE, MAE 및 결정계수 R2의 차이가 없는 것으로 나타났다.

2. 4가지 커널에서 파라미터를 튜닝 전 추정 정확도 는 차이가 있음을 쉽게 파악하였으나 파라미터 튜닝 후 추정 정확도가 향상되면서 커널별 차이가 아주 작은것 으로 파악되어[표 71 추정 정확도를 향상하기 위해서

튜닝이 필요한 것을 확인하였다.

3. 추정의 정확도를 높이기 위해서 오차를 허용할수있는 범위인 cost는 크게 하면서 데이터 샘플의 영향력을 행사하고 거리를 결정하는 gamma와 초평면의 폭을 결정하는 epsilon은 작아지는 것을 파악하였다.

4. 파라미터 값을 튜닝하여 적용한 결과 다항식 (polynomial) 커널과 시그모이드(sigmoid) 커널의추정 정확도가 크게 향상되었다.

본 연구의 시사점은 일반적으로 분류 분석 모델로 사용하는 서포트 벡터 머신이 회귀 분석 모델로 활용 가능한 것을 확인하였다는 학문적 의미와 오랜 시간이 소요되는 실제 공정에서 회귀 모델을 사용하면 빠른 시간에 새로운 결과를 예측하여 생산 원가를 감소시킬 수있다는 점과 유사 재생에너지 관련 공정에 적용 가능하다는 비지니스적 의미가 있다. 그러나 예측 성능 향상을 위하여 많은 건수의 데이터, 속성 및 머신러닝의 다른 알고리즘을 사용하여 비교하지 못한 점이 본 연구의한계점이라 생각하고, 향후 연구 방향에서는 이러한 한계점을 보완 후 추가 연구를 진행하여 페로브스카이트태양전지의 광 흡수층 박막 최적화에 대한 최적의 머신러닝 모델을 찾을 예정이다.

References

  1. 산업통상자원부, "제 9차 전력 수급 기본 계획," (2020.12)
  2. S. I. Seok, "Solvent-engineering for high performanceinorganic-organic hybrid perovskite solar cells," Nature Materials 13, 2014.
  3. A. Kojima, K. Teshima, Y. Shirai, T. Miyasaka, et al. J. Am. Chem. Soc. 131, 2009.
  4. J. Seo, S. Park, Y. C. Kim, N. J. Jeon, J. H. Noh, S. C. Yoon, and S. I. Seok, Energy Environ. Sci. 7, 2014.
  5. J. H. Heo, H. J. Han, D. S. Kim, T. K. Ahn and S. H. Im, Energy Environ. Sci. 8, 2015.
  6. K. B. Lee, S. H. Park, S. H. Sung, and D. M. Park, "A Study on the Prediction of CNC Tool Wear Using Machine Learning Technique," Journal of the Korea Convergence Society, Vol.10, No.11, 2019.
  7. D. Wu, C. Jennings, J. Terpenny, R. X. Gao, and S. Kumara, "A Comparative Study on Machine Learning Algorithms for Smart Manufacturing : Tool Wear Prediction Using Random Forests," Journal of Manufacturing Science and Engineering, Vol.139, No.7, 2017.
  8. A. Paniagua-Tineo, S. Salcedo-Sanz, C. Casanova-Mateo, E. G. Ortiz-Garcia, M. A. Cony, and E. Hernandez-Martin, "Prediction of daily maximum temperature using a support vector regression algorithm," Renewable Energy, Vol.36, No.11, 2011.
  9. A. J. Smola and B. Scholkopf, "A tutorial on support vector regression," Statistics and Computing Vol.14, No.3, 2004.
  10. H. T. Bang, S. Yoon, and H. Jeon, "Application of machine learning methods to predict a thermal conductivity model for compacted bentonite," Annals of Nuclear Energy, Vol.142, 2020.
  11. D. Basak, S. Pal, and D. C. Patranabis, Support vector regression, Neural Information Processing-Letters and Reviews, 2007.
  12. H. Zhong, J. Wang, H. Jia, Y. Mu, and S. Lv, "Vector field-based support vector regression for building energy consumption prediction," Applied Energy, Vol.242, 2019.
  13. Bloomberg NEF, New Energy Outlook 2018.
  14. 산업부, "재생에너지 3020 이행계획," 2017.2.
  15. 과기정통부(과학기술혁신본부), "2019년도 정부 연구개발 투자 방향 및 기준," 2018(3).
  16. 김종현, "고효율 페로브스카이트 태양전지용 전하수송 소재 개발 동향," 한국태양광발전학회지, Vol.5, No.1, pp.7-15, 2019.
  17. 김민, "고분자/페로브스카이트 하이브리드 나노결정합성 및 응용 기술 동향," 고분자 과학과 기술, Vol.32, No.2, pp.128-131, 2021.