A Study on the Speaker Adaptation in HMM Using Variable Number of Branches in Each State

상태당 가지수를 가변시킨 HMM을 이용한 화자적응화에 관한 연구

  • 김광태 (상주산업대학교 전자전기공학과) ;
  • 서정일 (경북대학교 전자전기공학과) ;
  • 한유수 (경북대학교 전자전기공학과) ;
  • 홍재근 (경북대학교 전자전기공학과)
  • Published : 1998.04.01

Abstract

본 논문에서는 CHMM인 CDHMM과 ARHMM을 이용하여 화자적응화 하는 방법을 각각 연구하였다. CDHMM에서는 최대사후화확률 추정법에 의하여 각 상태마다 하나의 가 지를 이용하여 화자에 적응시킨다. 본 논문에서는 음성의 다양한 음향학적 특징을 표현하기 위하여 상태마다 여러 개의 가지를 갖는 방법을 제안하였다. 상태마다의 적절한 가지 수를 결정하기 위하여 각 상태에 속하는 프레임 수와 특징 벡터들의 분산행렬의 행렬식값을 이용 하였다. ARHMM에서는 특징벡터로 선형예측계수를 사용하기 때문에 최대사후화확률 추정 법을 사용할 수 없게 된다. 따라서 화자독립모델을 이용하여 적응화자에 대한 음성을 Viterbi 알고리듬으로 상태별로 분할한 후 k-means 알고리듬을 이용하여 각 상태마다 하나 의 가지를 갖는 모델로 적응시키는 방법을 제안하였다.

Keywords

References

  1. 한국 정보처리학회 추계학술발표 논문집 v.4 no.2 ARHMM에서의 화자작응 김광태;서정일;홍재근
  2. 선호처리합동 학술대회 v.10 no.1 연속 혼합 가우스 밀도를 가지는 HMM에서의 화자적응 한유수;서정일;김광태;홍재근
  3. AT&T Technical Journal v.64 no.6 Recognition of isolated digits using hidden Markov models with continuous mixture densities L. R. Rabiner;B. H. Juang;S. E. Levinson;M. M. Sondhi
  4. Pattern Classification and Scene Analysis R. O. Duda;P. E. Hart
  5. Optimal Statistical Decisions M. H. DeGroot
  6. IEEE Trans. on ASSP v.33 no.6 Mixture autoregressive hidden Markov models for Speech Signals B. H. Juang;L. R. Rabiner
  7. IEEE Trans. on Signal Processing v.39 no.4 A study on speaker adptation of the parameters of continuous density hidden Markov models C. H.Lee;C. H. Lin;B. H. Juang