Decision Rule using Confidence Based Anti-phone Model and Interrupt-Polling Method for Distributed Speech Recognition DSP Networking System

분산형 음성인식 DSP 네트워킹 시스템을 위한 반음소 모델기반의 신뢰도를 사용한 결정규칙과 인터럽트-폴링

  • 송기창 (광운대학교 전자통신공학과) ;
  • 강철호 (광운대학교 전자통신공학과)
  • Received : 2010.02.03
  • Accepted : 2010.03.24
  • Published : 2010.07.31

Abstract

Far-talking recognition and distributed speech recognition networking techniques are essential to control various and complex home services conveniently with voices. It is possible to control devices everywhere at home by using only voices. In this paper, we have developed the server-client DSP module for distributed speech recognition network system and proposed a new decision rule to decide intelligently whether to accept the recognition results or not by the transferred confidence rate. Simulation results show that the proposed decision rule delivers better performances than the conventional decision by majority rule or decision by first-arrival. Also, we have proposed the new interrupt-polling technique to remedy the defect of existing delay technique which always has to wait several clients' results for a few seconds. The proposed technique queries all client's status after first-arrival and decides whether to wait or not. It can remove unnecessary delay-time without any performance degradation.

지능형 홈네트워크의 복잡하고 다양한 서비스를 음성인식을 이용해 편리하게 제어하기 위해서는 원거리 음성인식 및 분산 음성인식 네트워킹에 관한 방법은 필수적 요소이다. 이를 통해 가정의 어느 공간에서든 음성을 이용한 홈컨트롤이 가능해 진다. 본 논문에서는 분산형 음성인식 DSP 시스템 구성을 위하여 서버-클라이언트 형태로 구분된 DSP 확장형 모듈을 개발하였으며, 클라이언트 모듈이 전달하는 인식 결과의 신뢰도를 통합 분석하여 서버 모듈이 지능적으로 인식 결과를 판단하는 기법을 제안한다. 모의 실험 결과, 제안한 판단 기법은 기존의 다수결의 법칙이나, 선도착 우선의 법칙보다 우수한 인식 성능을 나타내었다. 또한, 선도착 클라이언트 결과가 도착한 후 무조건 일정 시간 타 클라이언트 결과를 기다려야 하는 기존의 지연(Delay) 방식의 단점을 해결하기 위하여, 인터럽트 폴링 기법을 제안한다. 제안한 인터럽트 폴링 기법은 서버 모듈이 클라이언트 모듈에게 현재 상태를 물어보고 클라이언트의 결과를 기다려야 할지 선택함으로써 불필요한 인식 지연시간을 없애고 인식율의 성능을 유지할 수 있다.

Keywords

References

  1. 강재구, 김성완, 임승린, "홈 네트워크(Home Network) 트랜드와 모델," 韓國컴퓨터 情報學會誌. 제16권 제2호, pp. 27-32, 2008.
  2. 이호웅, 정희석, "지능형 홈네트워크 시스템을 위한 가변어휘 연속음성인식시스템에 관한 연구," 韓國ITS學會 論文誌, 제7권 제2호, pp. 37-42, 2008.
  3. Lin, Q., Che, C., Yuk, D.-S., jin, L., De Vries, B., Pearson, J and Flanagan, J. "Robust Distant Talking Speech Recognition," In Proc. ICASSP, v.1. pp. 21-24, 1996.
  4. 권석봉, 지미경, 김회린, 이용주, "원거리 음성인식을 위한 MLLR적응기법 적용," 대한음성학회 말소리, 제53호, pp. 119-127, 2005.
  5. Nishiura, T., Hirano. Y., Denda. Y and Nakayama, M. "A study of suitable reverberation criteria for distant-talking speech recognition with room acoustic parameters," International Congress on Acoustics, pp.CAS-03-036, 2007.
  6. Hoi-Rin Kim, SiongHun Yi and Hang-Seop Lee, "Out-of- Vocabulary Rejection using Phone Filler Model in Variable Vocabulary Word Recognition," ICSP, v.1, pp. 337-339, 1999.
  7. 김우성, 구명완, "반음소 모델링을 이용한 거절 기능에 대한 연구," 한국음향학회지, 제18권, 제3호, pp. 3-9, 1999.
  8. Sunil K. Gupta and Frank K. Soong, "Improved Utterance Rejection Using Length Dependent Thresholds", ICSLP, pp. 795-798, 1998.
  9. Li Jiang and Xuedong Huang, "Vocabulary-Independent Word Confidence Measure Using Subword Features", ICSLP, pp. 401-404, 1998.
  10. M. Rahim, et al., "Discriminative utterance verification using minimum string verification error (MSVE) training," Proc. IEEE-ICASSP, pp. 3585-3588, 1996.
  11. 지미경, 김회린, "다채널 마이크 환경에서 Naive Bayesian Network의 Decision에 의한 음성인식 성능향상," 대한음성학회 05 추계 학술대회 발표논문집, pp. 151-154, 2005 Nov.