An Adaptive Pruning Threshold Algorithm for the Korean Address Speech Recognition

한국어 주소 음성인식의 고속화를 위한 적응 프루닝 문턱치 알고리즘

  • 황철준 (대구과학대학 정보전자통신계열) ;
  • 오세진 (영남대학교 전자정보공학부) ;
  • 김범국 (대구과학대학 정보전자통신계열) ;
  • 정호열 (영남대학교 전자정보공학부) ;
  • 정현열 (영남대학교 전자정보공학부)
  • Published : 2001.10.01

Abstract

In this paper, we propose a new adaptative pruning algorithm which effectively reduces the search space during the recognition process. As maximum probabilities between neighbor frames are highly interrelated, an efficient pruning threshold value can be obtained from the maximum probabilities of previous frames. The main idea is to update threshold at the present frame by a combination of previous maximum probability and hypotheses probabilities. As present threshold is obtained in on-going recognition process, the algorithm does not need any pre-experiments to find threshold values even when recognition tasks are changed. In addition, the adaptively selected threshold allows an improvement of recognition speed under different environments. The proposed algorithm has been applied to a Korean Address recognition system. Experimental results show that the proposed algorithm reduces the search space of average 14.4% and 9.14% respectively while preserving the recognition accuracy, compared to the previous method of using fixed pruning threshold values and variable pruning threshold values.

음성인식의 고속화를 위한 저자들에 의한 기존의 연구에서는 탐색이 진행함에 따라 시간방향의 탐색공간 문턱치를 가변적으로 적용하여 인식률의 저하없이 인식속도를 개선시켰다. 이 방법은 탐색 공간을 효과적으로 줄일 수는 있었으나 문턱치를 결정하기 위해서 여러 번의 사전 실험을 수행하여야 하는 번거러움이 있었다. 이러한 문제점을 해결하기 위하여 본 논문에서는 이전 탐색구간에 대한 최대우도와 후보들의 우도를 이용하여 현재 탐색구간의 문턱치를 탐색이 진행하는 과정에서 자동적으로 구하는 적응 프루닝 문턱치 알고리즘을 제안하였다. 제안한 알고리즘의 유효성을 확인하기 위해 국내 행정단위 시 (도), 구 (군), 동 (읍, 면), 번지를 구성하는 단어로 구성된 주소 인식 시스템에 적용하여 기존의 방법과 제안한 방법을 비교 검토하였다. 인식실험 결과, 연결단어 인식률 96.0%, 단어 인식률이 98.7%인 경우를 기준으로 하였을 때 제안된 방법이 기존의 고정 프루닝과 가변 프루닝 문턱치에 비하여 인식률 저하없이 각각 14.4%와 9.14%의 탐색 공간을 상대적으로 줄일 수 있어 제안된 방법의 유효성을 확인할 수 있었다.

Keywords

References

  1. 제15회 음성통신 및 신호처리 워크샵 논문집 음성인식 연구의 국내외 현황과 전망 정현열
  2. 2000년도 한국음향학회 학술발표대회 논문집 v.19 no.2 음성인식의 현황과 최근 연구 동향 김순협
  3. Ph. D Thesis Efficient Algorithms for Speech Recognition M. K. Ravishankar
  4. Proc. of Speech and Natural Language Workshop Applying SPHINX-Ⅱ to the DARPA Wall Street Journal CSR task Alleva, F.(et al.)
  5. Proc. IEEE ICASSP-97 v.1 JANUS-Ⅲ: Speech-to-speech translation in multiple languages Alon Lavie(et al.)
  6. Proc. ICSLP 92 A frame-synchronous continuous speech recognition algorithm using a top-down parsing of context-free grammar A. Kai;S. Nakagawa
  7. Proc. ICSLP v.3 Multimodal Drawing Tool Using Speech, Mouse and Keyboard T. Nishimoto;N. Shida;T. Kobayashi;K. Shirai
  8. ICSP'97 Spoken Dialogue in Multimodal Human Interface Katsuhiko Shirai
  9. ICSLP98 A Bimodal Korean Address Entry/Retrieval System Hyun-Yeol Chung;Cheol-Jun Hwang;Shi-Wook Lee
  10. 한국음향학회지 v.18 no.2 기능을 가진 주소입력 시스템의 개발과 평가 김득수;황철준;정현열
  11. 1999년도 한국음향학회 하계학술대회 논문집 v.18 no.1(s) 실시간 주소인식을 위한 시스템의 인식속도 개선 황철준;오세진;김범국;정호열;정현열
  12. SPECOM '99 An Adaptive Pruning Threshold Algorithm for Efficient Speech Recognition Cheol-Jun Hwang;Se-Jin OH;Ho-Youl Jung;Hyun-Yeol Chung
  13. 2000년도 한국음향학회 정기총회 및 학술발표대회 논문집 v.19 no.2(s) 음성인식의 고속화를 위한 프레임단위 프루닝 알고리즘 황철준;오세진;김범국;정호열;정현열
  14. Proc. IEEE ICASSP-95 v.1 A tree search strategy for large-vocabulary continous speech recognition P. S. Gopalakrishnan;L .R. Bahl;R. L. Mercer
  15. Proc. IEEE ICASSP-95 v.1 Lattice-based search strategies for large vocabulary speech recognition F. Richardson;M. Ostendorf;J. R. Rohlicek
  16. IEEE Trans. Acoustics. Speech and Signal Processing v.34 no.1 Speaker-Independent Isolated Word Recognition Using Dynamic Features of Speech Spectrum S. Furui
  17. 情報處理學會 第5回 全國大會 構文情報を用ぃた連續音聲認識 坂井利;中川聖一
  18. Ph. D thesis HARPY Speech Recognition System B. T. Lowerre
  19. Robustness in Automatic Speech Recognition J. C. Junqua;J. P. Haton
  20. Fundamentals of Speech Recognition L. Rabiner;B. H. Juang