Development of ChatGPT-based Medical Text Augmentation Tool for Synthetic Text Generation

합성 텍스트 생성을 위한 ChatGPT 기반 의료 텍스트 증강 도구 개발

  • Jin-Woo Kong (Dept. of Convergence Software, Hallym University) ;
  • Gi-Youn Kim (Dept. of Convergence Software, Hallym University) ;
  • Yu-Seop Kim (Division of Software, College of Information Science, Hallym University) ;
  • Byoung-Doo Oh (Cerebrovascular Disease Research Center, Hallym University)
  • 공진우 (한림대학교 융합소프트웨어학과) ;
  • 김기연 (한림대학교 융합소프트웨어학과) ;
  • 김유섭 (한림대학교 정보과학대학 소프트웨어학부) ;
  • 오병두 (한림대학교 뇌혈관질환 선도연구센터)
  • Published : 2023.07.12

Abstract

자연어처리는 수많은 정보가 수집된 전자의무기록의 비정형 데이터에서 유의미한 정보나 패턴 등을 추출해 의료진의 의사결정을 지원하고, 환자에게 더 나은 진단이나 치료 등을 지원할 수 있어 큰 잠재력을 가지고 있다. 그러나 전자의무기록은 개인정보와 같은 민감한 정보가 다수 포함되어 있어 접근하기 어렵고, 이로 인해 충분한 양의 데이터를 확보하기 어렵다. 따라서 본 논문에서는 신뢰할 수 있는 의료 합성 텍스트를 생성하기 위해 ChatGPT 기반 의료 텍스트 증강 도구를 개발하였다. 이는 사용자가 입력한 실제 의료 텍스트로 의료 합성 데이터를 생성한다. 이를 위해, 적합한 프롬프트와 의료 텍스트에 대한 전처리 방법을 탐색하였다. ChatGPT 기반 의료 텍스트 증강 도구는 입력 텍스트의 핵심 키워드를 잘 유지하였고, 사실에 기반한 의료 합성 텍스트를 생성할 수 있다는 것을 확인할 수 있었다.

Keywords

Acknowledgement

이 성과는 2022년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. 2022R1A5A8019303).