DOI QR코드

DOI QR Code

형상 형성 제어를 이용한 어휘인식 공유 모델의 가우시안 최적화

Gaussian Optimization of Vocabulary Recognition Clustering Model using Configuration Thread Control

  • 안찬식 (광운대학교 컴퓨터공학과) ;
  • 오상엽 (경원대학교 IT대학 컴퓨터 미디어)
  • 발행 : 2010.02.28

초록

연속 어휘 인식 확률 분포의 공유 방법에서는 사용될 모델 파라미터들의 초기 추정치를 생성하기 위한 각 문맥들에 대한 음소 데이터가 반드시 필요하지만 이들 음소 데이터에 대한 모델을 구성할 수 없는 단점으로 가우시안 모델의 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 확률 분포의 혼합 가우시안 모델을 최적화하고, 음소 단위로 데이터를 탐색을 지원하는 형상 형성 시스템을 제안한다. 본 논문의 형상 형성 시스템은 확장 facet 분류를 이용하여 사용자에게 음소 단위의 형상 형성 정보를 제공하므로 가우시안 모델의 정확성을 제공한다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 98.31%, 어휘 독립 인식률은 97.63%의 인식률을 나타내었다.

In continuous vocabulary recognition system by probability distribution of clustering method has used model parameters of an advance estimate to generated each contexts for phoneme data surely needed but it has it's bad points of gaussian model the accuracy unsecure of composed model for phoneme data. To improve suggested probability distribution mixed gaussian model to optimized that phoneme data search supported configuration thread system. This paper of configuration thread system has used extension facet classification user phoneme configuration thread information offered gaussian model the accuracy secure. System performance as a result of represent vocabulary dependence recognition rate of 98.31%, vocabulary independence recognition rate of 97.63%.

키워드

참고문헌

  1. 안태욱, "혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화," 대한전자공학회논문지, 제 42권, SP편 제 6호, 167-176쪽, 2005년 11월.
  2. 오상엽, 김홍진, 김영선, "UML을 이용한 컴포넌트 버전 제어 시스템 설계," 한국컴퓨터정보학회논문지, 제 8권 제 1호, 69-75쪽, 2003년 3월.
  3. 김덕현, 박성주, "확장된 객체지향 데이터 모형을 이용한 소프트웨어 변경 관리 시스템," 한국정보과학회논문지 제 22권 제 2호, 249-260쪽, 1995년
  4. 김행곤, "소프트웨어 재사용 지원 정보 저장소 구축," 한국정보과학회.정보처리학회 공동 특집호, 제 24권 제 11호, 14-31쪽, 2006년 11월.
  5. 오상엽, 최우승, "버전제어에서 컴포넌트의 형상형성 제어를 위한 객체지향 라이브러리," 한국컴퓨터정보학회논문지, 제 13권 제 6호, 51-58쪽, 2008년 11월.
  6. D. Jurafsky and J. H. Mntin, "Speech and Language Processing," Prentice-Hall, pp. 21-157, 2000.
  7. A. S. Manos and V. W. Zue, "A study on out-of-vocabulary word modeling for a segment-based keyword spotting system," Master Thesis, MIT, pp. 19-53, 1996.
  8. 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 대한전자공학회논문지, 제 43권, 제 6호 496-504쪽, 2006년
  9. L. R. Bahl, P. V. deSouza, P. S. Gopalakrishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," InProc. IEEE ICASSP-92, Vol. 1, pp.17-21, 1992.
  10. L. R. Rabiner, B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, pp. 18-181, 1993.
  11. T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp. 217-220, 1998.
  12. S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, pp. 17-81, 2002.
  13. Keith E. Gorlen, "An Object-Oriented Class Library for C++ Program," Software -Practice and Experience. Vol. 17(12), pp. 899-922, 1987. https://doi.org/10.1002/spe.4380171204
  14. 박서영, 김갑수, 명선영, 신영길, 우치수, "객체지향 패러다임에서의 소프트웨어 컴포넌트 분류에 관한 연구" 한국정보과학회논문지, 제 20권, 제 2호 879-882쪽,1993년.
  15. Ruben Prieto-Diaz and Peter Freeman, "Classifying Software for Reusability," IEEE Software, pp. 6-16, January 1987.
  16. R. Helm, Y. S. Maarek, "Integrating Information Retrieval and Domain Specific Approaches for Browsing and Retrieval in Object Oriented Class Libraries," Proceeding of OOPSLA'91, pp. 47-61, 1991.
  17. P. Devanbu, et al, "LaSSIE : A Knowledge Based Software Information System," CACM, Vol. 34, No.5, pp. 34-49, 1989.
  18. K. Demuynck, J. Duchateau, and D. Van Compernolle, "A static lexicon network representation for cross-word context dependent phones," In Proc. EUROSPEECH, Vol. 1, pp. 143-146, 1997.
  19. 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템," 한국컴퓨터정보학회논문지, 제 14권, 제 10호, 217-223쪽, 2009년 10월.