DOI QR코드

DOI QR Code

Analysis on Vowel and Consonant Sounds of Patent's Speech with Velopharyngeal Insufficiency (VPI) and Simulated Speech

구개인두부전증 환자와 모의 음성의 모음과 자음 분석

  • Sung, Mee Young (School of Computer Science & Engineering, Incheon National University) ;
  • Kim, Heejin (Otorhinolaryngology, Kyungpook National University School of Medicine) ;
  • Kwon, Tack-Kyun (Otorhinolaryngology, Seoul National University College of Medicine) ;
  • Sung, Myung-Whun (Otorhinolaryngology, Seoul National University College of Medicine) ;
  • Kim, Wooil (School of Computer Science & Engineering, Incheon National University)
  • Received : 2014.03.06
  • Accepted : 2014.03.31
  • Published : 2014.07.31

Abstract

This paper focuses on listening test and acoustic analysis of patients' speech with velopharyngeal insufficiency (VPI) and normal speakers' simulation speech. In this research, a set consisting of 50-words, vowels and single syllables is determined for speech database construction. A web-based listening evaluation system is developed for a convenient/automated evaluation procedure. The analysis results show the trend of incorrect recognition for VPI speech and the one for simulation speech are similar. Such similarity is also confirmed by comparing the formant locations of vowel and spectrum of consonant sounds. These results show that the simulation method for VPI speech is effective at generating the speech signals similar to actual VPI patient's speech. It is expected that the simulation speech data can be effectively employed for our future work such as acoustic model adaptation.

본 논문에서는 구개인두부전증 (VPI) 환자 발음과 정상인의 모의 발음에 대한 듣기 평가와 음향 분석을 실시한다. 본 연구를 위해 음성 데이터 수집을 위해 50개의 단어, 모음 및 단음절로 이루어진 발음 목록을 설정한다. 듣기 평가실험의 편의를 위해 웹 기반의 듣기 평가 시스템을 구축한다. 듣기 평가 결과는 실제 VPI 환자의 발음에 대한 오인식 경향과 모의 발음의 오인식 경향이 유사함을 나타낸다. 이러한 유사성은 모음의 포먼트 위치와 자음의 스펙트럼의 비교를 통해서도 확인할 수 있다. 실험 결과는 본 연구에서 사용한 정상인의 VPI 모의 발화 기법이 실제 환자의 음성을 비교적 효과적으로 모의하는 것을 반영하는 결과이다. 향후 VPI 환자의 음성 인식 과정에서 정상인의 모의 발화음성 데이터를 음향 모델의 적응 기법과 같은 분야에 유용하게 사용할 수 있을 것으로 기대한다.

Keywords

References

  1. S. G. Fletcher, "Theory and instrumentation for quantitative measurement of nasality," Cleft Palate Journal, vol. 7, pp. 601-609, 1970.
  2. J.-E. Lee, et al., "Research on Construction of the Korean Speech Corpus in Patient with Velopharyngeal Insufficiency," Korean Journal of Otorhinolaryngol - Head & Neck Surgery, vol.55, no.8, pp.498-507, 2012 . https://doi.org/10.3342/kjorl-hns.2012.55.8.498
  3. B.-W. Kim, et al., "A Study on the Design and the Construction of a Korean Speech DB for Common Use," Journal of the Acoustic Society of Korea, vol.16, no.4, pp.35-41, 1997.
  4. J. Yun, et al., "Nasometric and Acoustic Analysis in Experimentally Induced Velopharyngeal Insufficiency in Human," Journal of the Korean Society of Logopedics and Phoniatrics, vol8, no.2, pp.210-216, 1997.
  5. J. Shin, Voice of Korean Language, Jisk and Gyoyang, 2011.

Cited by

  1. Effective Recognition of Velopharyngeal Insufficiency (VPI) Patient's Speech Using Simulated Speech Model vol.19, pp.5, 2015, https://doi.org/10.6109/jkiice.2015.19.5.1243
  2. Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients vol.42, pp.11, 2014, https://doi.org/10.5626/jok.2015.42.11.1372
  3. DNN-HMM 기반 시스템을 이용한 효과적인 구개인두부전증 환자 음성 인식 vol.23, pp.1, 2014, https://doi.org/10.6109/jkiice.2019.23.1.33