VQ와 Fuzzy 이론을 이용한 단어인식

Word Recognition Using VQ and Fuzzy Theory

  • 김자용 (진주전문대학 전자계산과) ;
  • 최갑석 (명지대학교 전자공학과)
  • 발행 : 1991.08.01

초록

음성인식에 있어서 문제점의 하나는 발성자에 따른 주파수 변동문제이다. 본 논문에서는 이러한 음성 신호의 주파수 특성의 변동에 따른 영향을 해결하기 위하여 fuzzy 이론을 도입하였다. 여기서 표준패턴은 음성신호의 대표적인 특징들을 포함하고 있어야 하므로, 먼저 여러 화자가 발성한 단어들을 벡터 양자화한 코드북을 생성하였으며, 이코드북으로 부터 추출한 피크 주파수와 피크 에너지를 fuzzy화 패턴으로 작성하였다. 입력 음성신호로 부터 추출한 특징량인 스펙트럼의 피크 주파수와 피크에너지를 각각 멤버쉽 함수로 표현하여 fuzzy 추론에 의한 단어인식을 하였다. 실제 확신도 계산에 있어서는 계산량을 줄이기 위하여 fuzzy 값의 차만으로 확신도를 구하는 개선 확신도를 제안하여 사용하였다. 한국어 숫자음을 인식 실험한 결과 주파수 특성의 변동에 따른 영향을 해결할 수 있음을 확인하였으며, 제안된 개선 확신도 계산방법에 의해서 기억용량과 계산량을 감소 시킬 수 있었다.

The frequency variation among speakers is one of problems in the speech recognition. This paper applies fuzzy theory to solve the variation problem of frequency features. Reference patterns are expressed by fuzzified patterns which are produced by the peak frequency and the peak energy extracted from codebooks which are generated from training words uttered by several speakers, as they should include common features of speech signals. Words are recognized by fuzzy inference which uses the certainty factor between the reference patterns and the test fuzzified patterns which are produced by the peak frequency and the peak energy extracted from the power spectrum of input speech signals. Practically, in computing the certainty factor, to reduce memory capacity and computation requirements we propose a new equation which calculates the improved certainty factor using only the difference between two fuzzy values. As a result of experiments to test this word recognition method by fuzzy interence with Korean digits, it is shown that this word recognition method using the new equation presented in this paper, can solve the variation problem of frequency features and that the memory capacity and computation requirements are reduced.

키워드