DOI QR코드

DOI QR Code

Tei Index를 이용한 경도의 좌심실 이완 기능 장애 분류 모델 평가

Evaluation of Classification Models of Mild Left Ventricular Diastolic Dysfunction by Tei Index

  • 김수민 (한국의학연구소 부산센터 영상의학과) ;
  • 예수영 (부산가톨릭대학교 보건과학대학 방사선학과)
  • Su-Min Kim (Department of Radiology, Korea Medical Institute in Busan) ;
  • Soo-Young Ye (Department of Radiological Science, College of Health Sciences, Catholoic Universitiy of Pusan)
  • 투고 : 2023.09.17
  • 심사 : 2023.10.31
  • 발행 : 2023.10.31

초록

본 논문에는 경도의 좌심실 이완 기능 장애 유무를 분류하기 위해 TI을 측정하였다. 분류에 사용된 기계 학습 모델은 SVM과 KNN을 이용하였다. 총 306개의 데이터 중에서 206개는 트레이닝 데이터, 100개는 테스트 데이터로 사용하였다. 그 결과, SVM이 KNN에 비하여 비교적 높은 정확도를 보여 좌심실 이완 기능 장애 유무 진단에 더 유용함을 확인했다. 향후 연구에서 TI 뿐만 아니라 심장의 기능을 평가하는 다양한 지표들을 추가하고 더 많은 데이터를 확보한다면 분류 성능을 더 높일 수 있을 것으로 기대된다. 나아가, 타 질환의 예측 및 분류, 증가하는 검사 건수에 비해 부족한 의료 인력 문제를 해결하는데 기초 자료로 활용될 것으로 기대된다.

In this paper, TI was measured to classify the presence or absence of mild left ventricular diastolic dysfunction. Of the total 306 data, 206 were used as training data and 100 were used as test data, and the machine learning models used for classification used SVM and KNN. As a result, it was confirmed that SVM showed relatively higher accuracy than KNN and was more useful in diagnosing the presence of left ventricular diastolic dysfunction. In future research, it is expected that classification performance can be further improved by adding various indicators that evaluate not only TI but also cardiac function and securing more data. Furthermore, it is expected to be used as basic data to predict and classify other diseases and solve the problem of insufficient medical manpower compared to the increasing number of tests.

키워드

Ⅰ. INTRODUCTION

2021년 9월부터 상대적으로 고가였던 심장 초음파 검사의 건강보험 적용 범위가 대폭 확대되어 환자들의 검사 비용에 대한 부담이 현저히 줄었다[1]. 이에 일반 국민도 병원에서 비교적 저렴한 비용으로 심장 초음파 검사를 시행함으로써 매해 검사 건수가 기하급수적으로 증가할 것이 예상된다.

심장 초음파 검사는 심장의 해부학적 구조의 이상 유무, 심장의 기능 및 압력 등을 실시간으로 관찰할 수 있으며 비침습적이므로 대부분의 심장 질환에 중요하게 사용되고 있다[2]. Tei는 수축기에 장애가 있으면 등용적 수축기(isovolumic contractio time, IVCT)가 늘어나고 좌심실 박출시간(ejection time, ET)이 짧아지며, 수축기와 이완기 장애가 함께 있으면 심근 이완의 장애로 등용적 이완기(isovolumic relaxation time, IVRT)가 증가하는 데에 착안하여 IVCT와 IVRT의 합을 ET로 나눈 값을 Tei Index(TI)라는 명칭의 새로운 지표로 제시하였다[2]. Harada 등과 Tekten 등은 조직도플러를 이용해 심장의 한 주기에서 측정이 가능한 TI를 제안하였으며 현 임상에서 TI의 측정은 조직도플러 영상을 기본적으로 사용하고 있다[4-6].

좌심실 이완 기능은 좌심방에서 좌심실로 혈류를 채우는 능력을 말하며 좌심실 이완 기능 장애는 좌심실 비대를 일으키는 질환에서 단독으로 또는 타 질환과 동반되어 나타나는 등 광범위한 심장질환에서 나타난다. 경도의 좌심실 이완 기능 장애는 심장질환이 없는 건강한 사람에게도 흔히 관찰될 수 있으며 특히 노화에 따라 좌심실의 순응도는 점차 감소하여 노인에게는 흔하게 관찰된다[2,7].

좌심실 이완 기능 장애는 심혈관 질환의 강력한 예측 인자이므로 이완기 기능을 정확히 평가하는 것은 매우 중요하다[8]. 좌심실 이완 기능의 평가는 2D 영상과 도플러 파형을 이용한 지표들을 적극적으로 활용하여 이완기능 장애의 단계를 판단한다[9]. 그러나 이들 지표는 환자의 나이와 기저 질환에 영향을 받기 때문에 모든 사람에게 적용하기에는 어렵다. 반면, TI는 도플러를 이용해 쉽게 측정할 수 있으며, 침습적 검사법인 심도자법으로 측정한 이완기 기능지표와 밀접한 상관성을 보이는 것으로 보고되었다[10].

최근 의료 분야에서의 차세대 기술은 컴퓨터가 스스로 학습하는 인공지능을 접목하는 것이다. 현재까지 인공지능은 의료 분야에서 광범위하게 활용되고 있으며 특히 질병의 발견 및 예측, 분류까지 임상 분야에서 빠르게 적용되고 있다. 따라서 국가 정책에 따른 검사 건수의 증가에 대비하기 위해 진단의 보조적인 역할을 기대할 수 있다.

따라서 본 연구에서는 본 연구에서는 IVCT, IVRT, ET와 TI 값을 측정하고 각 측정치와 대상자의 특성을 입력하여 좌심실 이완 장애 유무를 분류하기 위해 기계학습을 이용하고자 한다.

Ⅱ. MATERIAL AND METHODS

1. Subjects

본 연구는 2021년 5월부터 2022년 5월까지 부산소재 W의원에서 검진 목적으로 심장초음파 검사 중 조직도플러 영상을 획득한 만 20세 이상 성인남녀 306명을 대상으로 시행하였다. 대상자 중 경증이상의 판막 질환자, 심전도상 전도 장애가 있는 자, 심실 벽 운동 장애가 있는 자, 그 외 심각한 심박동의 변이가 있는 자와 같은 TI를 측정하기 어려움이 있는 경우는 제외하였다. 대상자의 일반적 특성은 Table 1에 나타내었다. 본 연구는 부산가톨릭대학교 생명윤리심의위원회(IRB)의 연구 승인을 받았다(CUPIRB-2022-01-010).

Table 1. Clinical baseline characteristics of subjects

BSSHB5_2023_v17n5_761_t0001.png 이미지

BMI : body mass index, LVDD : left ventricle diastolic dysfunction

2. Parameters

2.1. Tei Index (TI)

TI란 심근 성능 지수를 말하며 측정 방법은 Fig. 1과 같으며 Eq. (1)과 같이 계산된다. Eq. (1)에서 등용적 수축기 시간(IVCT)은 방실 판막이 닫히고 심실이 수축하기 시작할 때부터 대동맥판이 열릴때까지의 시간을 의미하며 이 시기에는 심실 부피의 변화 없이 심실 내압만 증가한다. 등용적 이완기 시간(IVRT)은 수축기 끝에 심실 내압이 빠르게 낮아지면서 대동맥판이 닫히게 되는데 방실 판막이 열릴 때까지 심장의 모든 판막이 닫혀있는 시간을 의미한다. 이 시기에는 심실 부피의 변화 없이 심실 내압만이 변화한다. 박출 시간(ET)은 대동맥판이 열리고 닫힐 때까지의 시간을 말한다.

BSSHB5_2023_v17n5_761_f0001.png 이미지

Fig. 1. Schematic representation of the measurement of the cardiac time intervals.

\(\begin{aligned}T I=\frac{I V C T+I V R T}{E T}\end{aligned}\)       (1)

2.2. 기계학습모델

기계학습은 인공지능의 한 분야이면서 머신러닝(Machine Learning)이라고도 불리며 경험을 통해 주어진 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법을 통칭한다[11,12]. 기계학습은 학습 방식에 따라 세가지로 나누어지며 이는 지도학습(Supervised learning), 비지도학습(Unsupervised learning), 강화학습(Reinforcement learnng)이다. 지도학습은 입력 데이터와 출력 데이터를 모두 제공하여 기계를 학습시키는 방법을 말하며, 비지도학습은 데이터 자체에서 어떠한 패턴을 찾아내는 학습방법을 말한다. 강화학습은 여러 시행착오를 거쳐서 얻은 데이터를 기반으로 모델을 지속적으로 개선하는 방식을 말한다[13]. 본 연구에서는 기계학습 중에서 지도학습 분류모형 중 가장 기본적인 SVM과 KNN을 이용하였다.

1) k 최근접 이웃(k-Nearest Neighbor, KNN)

KNN은 기존의 데이터의 상관관계나 유사도를 이용하여 분류 결과를 참조하는 방식으로 입력된 데이터와 가장 유사하고, 가까운 K개의 데이터를 선택한다. 선택된 데이터의 분류 결과를 가중치로 이용하여 분류결과를 결정하며, 다수결 방식 등을 통해 분류 결과 도출이 가능하다. KNN은 구현하기 쉽고 간단하여 빠른 학습이 가능하며 수치 기반 데이터 분류 작업에서 성능이 우수하다.

2) 서포트 벡터 머신(Support Vector Machine, SVM)

SVM은 서로 다른 집단에 속해 있는 범주형 데이터를 분류하는 최적의 초평면(hyperplane)을 찾는 모델이다. 입력 데이터를 n 차원 공간으로 매핑(mapping) 한 뒤, 이 공간에서 데이터를 분류하는 결정경계를 찾는다. 결정경계는 서포트 벡터로부터 최대한 멀리 떨어지도록 찾는다. SVM은 결정경계가 서포트 벡터이기 때문에 데이터 포인트 중에서 서포트 벡터만 잘 골라내면 나머지 데이터 포인트들을 무시할 수 있다.

2.3. 분류 성능 평가

분류 모델의 성능을 평가하기 위해 가장 흔히 사용되는 것은 혼동 행렬(Confusion matrix)이다. 혼동행렬은 실제 값과 예측 모델에 의해 분류된 예측된 값의 발생 빈도를 나타낸 것을 말하며 오류행렬(Error matrix)이라고도 한다[14]. 혼동 행렬을 바탕으로 재현율(recall), 정밀도(precision) 그리고 정확도(accuracy)를 이용하여 예측 성능을 평가한다. 혼동행렬은 Table 2와 같이 나타낼 수 있다. 혼동행렬은 참으로 예측하고 참인 경우 TP (True positive), 거짓으로 예측하고 거짓인 경우 TN (True negative), 참으로 예측했으나 거짓인 경우 FP (False positive), 거짓으로 예측했으나 참인 경우 FN (False negative)이라 한다.

Table 2. Confusion matrix

BSSHB5_2023_v17n5_761_t0002.png 이미지

정확도는 전체 분류 중에서 정분류한 비율이고 정밀도는 예측이 참이라고 예측한 것 중 정분류한 비율로 긍정 예측도(Positive predictive value, PPV)라고도 한다. 재현율은 민감도(Sensitivity) 또는 사실-긍정율(True-positive rate)라고도 불리며 실제로 참인 것 중에서 정분류한 비율이다. 이를 바탕으로 재현율, 정밀도 및 정확도는 아래 Eq. (2), Eq. (3), Eq. (4)로 정의된다.

\(\begin{aligned}Precision=\frac{TP}{TP+FP}\end{aligned}\)       (2)

\(\begin{aligned}Recall =\frac{TP}{TP+FN}\end{aligned}\)       (3)

\(\begin{aligned}Accuracy=\frac{TP+TN}{TP+TN+FP+FN}\end{aligned}\)       (4)

TP: True Positive, TN: True Negative

FP: False Positive, FN: False Negative

본 연구에서는 총 306개의 데이터 중 206개를 트레이닝 데이터, 100개는 테스트 데이터로 설정하였다. K-Fold Cross-Validation을 시행하였고 5번의 fit를 진행하였다(k=5). 분류모델은 SVM과 KNN 이용하였다. 분류기의 성능 평가를 위해 혼동행렬의 TP, TN, FP, FN을 이용한 정밀도, 재현율, 정확도를 사용하였다.

모든 분류학습 및 평가는 MATLAB R2015a(Mathworks, Natick, MA, USA)의 분류학습기앱을 이용하였다.

Ⅲ. RESULT

1. Results of Measurement

본 연구에서는 건강한 성인 306명을 대상으로 데이터를 얻었다. 측정된 IVCT, IVRT, ET를 이용하여 TI를 계산하였다. 각 측정치의 평균값과 표준편차를 계산하였으며 이는 Table 3에 나타냈다.

Table 3. The results of TI, IVCT, IVRT and ET

BSSHB5_2023_v17n5_761_t0003.png 이미지

2. Results of Confusion matrix

트레이닝을 완료한 SVM, KNN 학습 모델을 이용하여 100개의 데이터로 테스트를 시행하였으며, 그 결과는 Table 4과 Table 5와 같다.

Table 4. Confusion matrix of SVM

BSSHB5_2023_v17n5_761_t0004.png 이미지

LVDD : left ventricular diastolic dysfunction

Table 5. Confusion matrix of KNN

BSSHB5_2023_v17n5_761_t0005.png 이미지

LVDD : left ventricular diastolic dysfunction

3. Results of Classification Models

혼동 행렬을 바탕으로 재현율(recall), 정밀도(precision), 정확도(accuracy)를 계산하였고 결과는 Table 6에 나타냈다.

Table 6. The results of TI, IVCT, IVRT and ET

BSSHB5_2023_v17n5_761_t0006.png 이미지

Ⅳ. DISCUSSION

좌심실 이완 기능 장애는 심혈관 질환의 강력한 예측 인자이다. 따라서 이완기 기능을 정확히 평가하는 것이 중요하다. 임상에서 심장 초음파는 좌심실 이완 기능 평가에 간편하게 이용되는 중요한 진단 방법으로 널리 이용되고 있다[2].

본 연구는 건강한 성인 306명을 대상으로 시행하였으며 성별, 나이, BMI, 좌심실 이완 장애의 유무로 일반적 특성을 분류하였다. 모집군 306명을 대상으로 IVCT, IVRT, ET, TI 값의 평균, 표준편차, 최댓값, 최솟값을 산출하였다. MATLAB의 분류학습기를 이용해 306명의 검사자 데이터 값 중 206명의 데이터를 가지고 기계학습 모델을 트레이닝한 뒤, 나머지 100명의 데이터를 가지고 본 테스트를 진행하였다. 그 결과, 트레이닝을 진행한 SVM 값은 82% 가 나왔고, KNN은 79%의 정확도를 보였으며, 테스트한 SVM 값은 90.8%, KNN은 88.8%가 도출되었다. 이를 통해 SVM이 좌심실 이완 장애 분류에는 정확성이 더 높음을 알 수 있었다. 하지만 기계학습 모델은 정확성이 90%를 넘어야 양호한 분류기 모델이라 할 수 있으나 본 논문의 결과 내용에서 비교적 신뢰값이 떨어짐을 볼 수 있었다. 이러한 점을 보완하고, 높은 수준의 정확성을 얻기 위해서 더 많은 표본을 확보해야 한다. 본 논문을 기초자료로 활용하여 학습 분류기를 사용한다면, 좌심실 이완 장애 유무 진단에 높은 정확성을 가질 수 있다. 또한, 앞으로의 질병 유무 진단에 대한 부분과 여러 의학적 분류 부분까지 더 많은 도움이 될 수 있을 것으로 기대된다.

Ⅴ. CONCLUSION

본 논문에는 경도의 좌심실 이완 기능 장애 유무를 분류하기 위해 TI을 측정하였다. 분류에 사용된 기계학습 모델은 SVM과 KNN을 이용하였다. 그 결과, SVM이 KNN에 비하여 비교적 높은 정확도를 보여 좌심실 이완 기능 장애 유무 진단에 더 유용함을 확인했다. 향후 연구에서 TI 뿐만 아니라 심장의 기능을 평가하는 다양한 지표들을 추가하고 더 많은 데이터를 확보한다면 분류 성능을 더 높일 수 있을 것으로 기대된다. 나아가, 타 질환의 예측 및 분류, 증가하는 검사 건수에 비해 부족한 의료 인력 문제를 해결하는데 기초 자료로 활용될 것으로 기대된다.

Acknowledgement

본 연구는 2023년 부산가톨릭대학교 교내학술 연구과제로 수행되었다.

참고문헌

  1. Ministry of Health and Welfare(MOHW), 17th Health Insurance Policy Deliberation Committee held, 2021. 
  2. Korea Society of Echocardiography, KSE Textbook of Echocardiography 4th Ed., Korean medicine, Soul, Korea, 2019. 
  3. C. Tei, "New non-invasive index for combined systolic and diastolic ventricular function", Journal of Cardiology, Vol. 26, No. 2, pp. 135-136, 1995. 
  4. A. M. Yassin, G. A. Abdelrazek, R. A. Soliman, K. A. Elkhashab, S. H. Zaky, "Role of Tissue Doppler Tei Index in Evaluating Myocardial Performance after Coronary Revascularization", Journal of Clinical and Experimental Cardiology, Vol. 9, No. 6, 2018. http://dx.doi.org/10.4172/2155-9880.1000590 
  5. K. Harada, M. Tamura, M. Toyono, K. Oyama, G. Takada, "Assessment of global left ventricular function by tissue Doppler imaging", The American Journal of Cardiology, Vol. 88, No. 8, pp. 927-932, 2001. http://dx.doi.org/10.1016/S0002-9149(01)01912-9 
  6. T. Tekten, A. Onbasili, C. Ceyhan, S. Unal, B. Discigil, "Value of Measuring Myocardial Performance Index by Tissue Doppler Echocardiography in Normal and Diseased Heart", Japanese Heart Journal, Vol. 44, No. 3, pp. 403-416, 2003. http://dx.doi.org/10.1536/jhj.44.403 
  7. H. Masugata, S. Senda, K. Yoshikawa, Y. Yoshihara, H. Daikuhara, Y. Ayada, H. Matsushita, H. Nakamura, T. Taoka, M. Kohno, "Relationships between Echocardiographic Findings, Pulse Wave Velocity, and Carotid Atherosclerosis in Type 2 Diabetic Patients", Hypertension Research, Vol. 28, No. 12, pp. 965-971, 2005. http://dx.doi.org/10.1291/hypres.28.965 
  8. M. R. Zile, D. L. Brutsaert, "New Concepts in Diastolic Dysfunction and Diastolic Heart Failure: Part I: Diagnosis, Prognosis, and Measurements of Diastolic Function", Circulation : Journal of the American Heart Association, Vol. 105, No. 11, pp. 1387-1393, 2002. http://dx.doi.org/10.1161/hc1102.105289 
  9. S. F. Nagueh, C. P. Appleton, T. C. Gillebert, P. N. Marino, J. K. Oh, O. A. Smiseth, A. D. Waggoner, F. A. Flachskampf, P. A. Pellikka, A. Evangelista, "Recommendations for the evaluation of left ventricular diastolic function by echocardiography", Journal of the American Society of Echocardiography, Vol. 22, No. 2, pp. 107-133, 2009. https://doi.org/10.1016/j.echo.2008.11.023 
  10. C. Tei, R. A. Nishimura, J. B. Seward, A. J. Tajik, "Noninvasive Doppler-derived myocardial performance index: correlation with simultaneous measurements of cardiac catheterization measurements", Journal of the American Society of Echocardiography, Vol. 10, No. 2, pp. 169-178, 1997. http://dx.doi.org/10.1016/s0894-7317(97)70090-7 
  11. A. L. Samuel, "Some Studies in Machine Learning Using the Game of Checkers", IBM Journal of Research and Development, Vol. 3, No. 3, pp. 210-229, 1959. http://dx.doi.org/10.1147/rd.33.0210 
  12. C. M. Kwon, Complete Guide to Python Machine Learning: Learn everything from basic algorithms to the latest techniques with various Kaggle examples, Paju, WIKIBOOKS, 2020 
  13. A. Muller, S. Guido, Introduction to Machine Learning with Python: A Guide for Data Scientists, 1st Ed., O'Reilly Media, California, U. S., 2016. 
  14. S. V. Stehman, "Selecting and interpreting measures of thematic classification accuracy", Remote Sensing of Environment, Vol. 62, No. 1, pp. 77-89, 1997. http://dx.doi.org/10.1016/S0034-4257(97)00083-7