DOI QR코드

DOI QR Code

Application of sinusoidal model to perception of electrical hearing in cochlear implants

인공와우 전기 청각 인지에 대한 정현파 모델 적용에 관한 연구

  • Lee, Sungmin (Speech-Language Pathology and Audiology, Tongmyong University)
  • 이성민 (동명대학교 언어치료청각학과)
  • Received : 2021.11.09
  • Accepted : 2021.12.03
  • Published : 2022.01.31

Abstract

Speech consists of the sum of complex sine-waves. This study investigated the perception of electrical hearing by applying the sinusoidal model to cochlear implant simulation. Fourteen adults with normal hearing participated in this study. The sentence recognition tests were implemented using the sentence lists processed by the sinusoidal model which extracts 2, 4, 6, 8 sine-wave components and sentence lists processed by the same sinusoidal model along with cochlear implant simulation (8 channel vocoders). The results showed lower speech recognition for the sentence lists processed by the sinusoidal model and cochlear implant simulation compared to those by the sinusoidal model alone. Notably, the lower the number of sine-wave components (2), the larger the difference was. This study provides the perceptual pattern of sine-wave speech for electrical hearing by cochlear implant listeners, and basic data for development of speech processing algorithms in cochlear implants.

어음은 복잡한 정현파들의 합으로 구성된다. 본 논문은 정현파 모델을 인공와우 시뮬레이션에 적용하여 인공와우 사용자의 전기 청각 인지 메커니즘을 정상 청력인의 음향 청각 인지 메커니즘과 비교하였다. 이를 위해 정상 청력을 지닌 14명의 성인들이 본 연구에 참여하였다. 2, 4, 6, 8개의 정현파 성분만을 추출하는 정현파 모델이 적용된 문장과 정현파 모델과 인공와우 시뮬레이션(8 채널 보코더)이 함께 적용된 문장에 대한 어음인지도 검사를 실시하였다. 연구결과, 인공와우 시뮬레이션이 함께 적용된 정현파 문장에서 통계적으로 낮은 어음인지도를 보였으며, 특히 적은 수(2개)의 정현파 성분에서 큰 차이를 보였다. 본 연구는 정현파 모델에 대한 인공와우 사용자의 전기 청각 인지 패턴의 특성을 제시하며, 인공와우 어음처리 알고리즘의 개발에 대한 기초 자료를 제공한다.

Keywords

Acknowledgement

이 논문은 2021년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임(NRF-2021S1A5A806455811).

References

  1. R. J. McAulay and T. F. Quatieri, "Speech analysis/Synthesis based on a sinusoidal representation," IEEE Trans. Acoust. 34, 744-754 (1986).
  2. D. H. Lim, "Speech coding strategies in the scala tympanic electrode array of the cochlear implant system" (in Korean), Audio. 1, 8-13 (2005).
  3. S. M. Lee, S. Akbarzadeh, S. Singh, and C. T. Tan, "A speech processing strategy based on sinusoidal speech model for cochlear implant users," Proc. APSIPA. Convention paper, 393-397 (2018).
  4. S. M. Lee, S. Akbarzadeh, and C. T. Tan, "Neural tracking of band-limited sine-wave speech in normal hearing and cochlear implant listeners," Int. J. Speech-Lang. Pathol. 8, 38-49 (2020). https://doi.org/10.12970/2311-1917.2020.08.06
  5. J. H. Lee, S. J. Cho, J. S. Kim, H. S. Jang, D. H. Lim, K. W. Lee, and H. J. Kim, Korean Speech Audiometry (KSA) (Hakjisa, Seoul, 2010), pp. 1-448.
  6. Personal Hompage, https://www.ee.columbia.edu/~dpwe/resources/matlab/sinemodel/, (Last viewed December 25, 2021).
  7. Personal Hompage, http://www.tigerspeech.com/angelsim/angelsim_about.html, (Last viewed December 25, 2021).
  8. D. D. Greenwood, "A cochlear frequency-position function for several species-29 years later," J. Acoust. Soc. Am. 87, 2592-2605 (1990). https://doi.org/10.1121/1.399052
  9. O. Timms, Speech processing strategies based on the sinusoidal speech model for the profoundly hearing impaired, (Doctoral thesis, University Hospital of Zurich, 2003).
  10. J. M. Kates, "Speech enhancement based on a sinusoidal model," J. Speech Hear. Res. 37, 449-464 (1994). https://doi.org/10.1044/jshr.3702.449
  11. P. C. Loizou, M. Dorman, and Z. Tu, "On the number of channels needed to understand speech," J. Acoust. Soc. Am. 106, 2097-2103 (1999). https://doi.org/10.1121/1.427954