Efficient context dependent process modeling using state tying and decision tree-based method

상태 공유와 결정트리 방법을 이용한 효율적인 문맥 종속 프로세스 모델링

  • 안찬식 (광운대학교 컴퓨터공학과) ;
  • 오상엽 (경원대학교 IT대학 컴퓨터미디어)
  • Received : 2009.11.16
  • Accepted : 2010.03.11
  • Published : 2010.03.31

Abstract

In vocabulary recognition systems based on HMM(Hidden Markov Model)s, training process unseen model bring on show a low recognition rate. If recognition vocabulary modify and make an addition then recreated modeling of executed database collected and training sequence on account of bring on additional expenses and take more time. This study suggest efficient context dependent process modeling method using decision tree-based state tying. On study suggest method is reduce recreated of model and it's offered that robustness and accuracy of context dependent acoustic modeling. Also reduce amount of model and offered training process unseen model as concerns context dependent a likely phoneme model has been used unseen model solve the matter. System performance as a result of represent vocabulary dependence recognition rate of 98.01%, vocabulary independence recognition rate of 97.38%.

HMM(Hidden Markov Model)을 사용하는 어휘 인식 시스템에서 인식 시 훈련 중에 나타나지 않는 모델들로 인해 인식률의 저하를 가져오며 인식 대상 어휘가 변경되거나 추가되면 데이터베이스의 수집과 훈련 과정을 수행하여 모델을 재생성해야 하고 그에 따른 시간과 추가 비용이 초래된다. 본 논문에서는 결정 트리 방법과 모델 공유 방법을 사용하여 효율적인 문맥 종속 프로세스 모델링 방법을 제안하였다. 제안한 방법은 생성된 모델들로부터 모델 공유 방법을 이용하여 모델의 재생성 과정을 줄이고 강인하고 정확한 문맥 종속 음향 모델링을 제공한다. 또한, 모델의 수를 줄이고 훈련 중에 나타나지 않는 모델들에 대해 문맥 종속 유사 음소 모델을 제공하여 훈련 중에 나타나지 않는 모델의 문제점을 해결하고 훈련성을 확보하였다. 제안된 방법으로 6종류의 음성 데이터베이스를 이용하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 어휘 종속 인식 실험에서는 98.01%의 성능을 보였고, 어휘 독립 인식 실험에서 97.38%의 성능을 보였다.

Keywords

References

  1. L. Rabiner, B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, 1993.
  2. L. R. Bahl, P. V. deSouza, P. S. Gopalarishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," In Proc. IEEE ICASSP-92, Vol.1, pp. 17- 21, 1992.
  3. A. S. Manos and V. W. Zue, "A study on ou-tof- vocabulary word modeling for a segment-based keyword spotting system," Master Thesis, MIT, 1996.
  4. 안태옥, "혼합 가우시안 군집화를 이용한 상태공유 음향모텔 최적화," 전자공학회논문지, 제42권 SP편 제6호, pp. 167-176, 2005. 11.
  5. 신광호, 정호열, 정현열, "음성 개선 기반의 모델 보상 기법을 이용한 강인한 잡음 음성 인식," 음향학회 논문지, Vol.27, No.4, pp. 191-199, 2008. 5.
  6. 방기덕, 강철호,"가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구," 멀티 미디어학회논문지, Vol. 11, No. 11, pp. 1471-1479, 2008. 11.
  7. W. Daelemans, S. Buchholz, and J. Veenstra, "Memorybased shallow parsing," in Proc CoNLL, pp. 53-60, 1999.
  8. W. Reichl and W. chou, "Decision Tree State Tying Based on Segmental Clustering for Acoustic Modeling," Proc ICASSP, Seattle, pp. 801-804, 1998.
  9. M. F. Gales, "Model- based techniques for nosie robust speech recognition," Ph. D. dissertation, University of Cambridge, Sept, 1995.
  10. D. Jurafsky and J. H. Martin, "Speech and Language Processing," Prentice- Hall, 2000.
  11. 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 전자공학회논문지, 제43권 6호, pp.496-504, 2006.
  12. T. jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp. 217-220, 1998.
  13. Herry F. Korth, Abraham Silberschat,. Database system concepts, 1991.
  14. Tichy, W. F., "Rcs-A System for Version Control," Software Practice & Experience, Vol.15 No.7, pp. 637-654, 1985. https://doi.org/10.1002/spe.4380150703
  15. Hyoungjoo Kim, and Henery F. Korth. Schema Version and View a in Object-ori-ented Database. Proc. INFO JAPAN. 1990.
  16. Agrawal, R. Buroff, S., Gehani, N. and Shasha, D "Object Versioning in code," processing of 7th International Conference on Data Engineering, pp. 446-455, 1991.
  17. 김덕현, 박성주,"확장된 객체지향데이터 모형을 이용한 소프트웨어 변경관리 시스템," 정보과학회논문지, Vol.22, No.2. pp. 249-260, 1995.
  18. Keith E. Gorlen "An Object-Oriented Class Library for C++ Program," Software-Practice and Experience. Vol.17, No.12. pp. 899-922. 1987. https://doi.org/10.1002/spe.4380171204
  19. 박서영, 김갑수, 명선영, 신영길, 우치수, "객체지향 패러다임에서의 소프트웨어 컴포넌트 분류에 관한 연구," 정보과학회논문지, Vol.20, No.2, pp. 879- 882. 1993.
  20. R. Helm, Y. S. Maarek, "Integrating Information Retrieval and Domain Specific Approaches for Browsing and Retrieval in Object Oriented Class Libraries," Proceeding of OOPSLA'91, pp. 47-61, 1991.
  21. S. Young, D. Kershaw, J Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, 2002.