The Optimal and Complete Prompts Lists Generation Algorithm for Connected Spoken Word Speech Corpus

연결 단어 음성 인식기 학습용 음성DB 녹음을 위한 최적의 대본 작성 알고리즘

  • 유하진 (서울시립대학교 컴퓨터과학부)
  • Published : 2004.02.01

Abstract

This paper describes an efficient algorithm to generate compact and complete prompts lists for connected spoken words speech corpus. In building a connected spoken digit recognizer, we have to acquire speech data in various contexts. However, in many speech databases the lists are made by using random generators. We provide an efficient algorithm that can generate compact and complete lists of digits in various contexts. This paper includes the proof of optimality and completeness of the algorithm.

연결 단어 인식기, 특히 연결 숫자음 인식기를 제작하기 위한 음성 데이터베이스를 구축하는데 있어서 완전하고 효율적인 발성목록을 작성하기 위한 알고리즘을 제안한다. 기존의 음성 DB에서 사용되는 목록은 주로 난수 발생기에 의하여 만들어지거나 사용자의 전화번호, 우편번호 등을 이용하여 만들어져 왔으므로 다양한 환경의 음소 또는 단어를 균일하게 포함하고 있지 못하다. 따라서 본 논문에서는 하나의 단어에 대하여 전후에 모든 단어가 연결되는 조합을 모두 한번씩 포함하는 목록을 만드는 효율적인 알고리즘을 제안한다. 본 알고리즘으로 7연 숫자 목록을 만들면 200개의 문장으로 모든 조합을 포함할 수 있게 된다. 본 논문에서는 알고리즘 예제와 본 알고리즘의 완전성과 효율성에 대하여 기술하였다.

Keywords

References

  1. Electronics Letters v.31 no.19 Context-dependent word duration modeling for Korean connected digit recognition Kwon,O.W.;Un,C.K.
  2. Proceedings of 2001 International Symposium on Intelligent Multimedia, Video and Speech Processing Efficient decoding algorithms for Mandarin connected digit speech recognition Zhu Xuan;Li Husheng;Lin Jia;Liu Runsheng
  3. The LDC Corpus Catalog
  4. The LDC Corpus Catalog
  5. Proceedings of IEEE 4th Workshop on Interactive Voice Technology for Telecommunications Applications, IVTTAETWR-98 Connected digit recognition experiments with the OGI Toolkit's neural network and HMM-based recognizers Cosi,P.;Hosom,J.P.;Shalkwyk,J.;Sutton,S.;Cole,R.A.