DOI QR코드

DOI QR Code

Real-time Phoneme Recognition System Using Max Flow Matching

최대 흐름 정합을 이용한 실시간 음소인식 시스템 구현

  • Lee, Sang-Yeob (Dept. of Management Information System, Sahmyook University) ;
  • Park, Seong-Won (Industry Research Team, Korea Creative Content Agency)
  • 이상엽 (삼육대학교 경영정보학과) ;
  • 박성원 (한국콘텐츠진흥원 산업분석팀)
  • Received : 2012.01.30
  • Accepted : 2012.02.18
  • Published : 2012.02.20

Abstract

There are many of games using smart devices. Voice recognition is can be useful way for input. In the game, voice have to be quickly recognized, at the same time it have to be manipulated promptly as well. In this study, we developed the optimized real-time phoneme recognition using max flow matching that it can be efficiently used in the game field. Firstly, voice wavelength is transformed to FFT, secondly, transformed value is made by a graph in Z plane, thirdly, data is extracted in specific area, and then data is saved in database. After all the value is recognized using weighted bipartite max flow matching. This way would be useful method in game or robot field when researchers hope to recognize the fast voice recognition.

스마트 디바이스를 이용한 다양한 게임들이 증가하고 있는데, 음소인식은 스마트 디바이스를 사용한 효율적인 입력 방법은 음성이 될 수 있다. 게임에서 음성인식은 매우 빠르게 인식되면서 구동 되어야하는데, 본 연구에서는 게임 분야에서 유용하게 활용할 수 있는 최적화된 음소 인식 방법을 개발하였다. 본 논문에서 제안하는 음소 인식 방법은 음성 파장을 FFT로 전환하고, 해당 값을 Z평면에 도시한 후, 영역 데이터를 추출한 후 데이터베이스에 저장한다. 그리고 해당 값을 가중치 있는 두 갈래 그래프 최대 흐름 정합을 사용하여 음소 인식을 한다. 제안된 방법은 게임 또는 로봇과 같은 분야에서 빠른 음소 인식을 하고자 할 때 매우 유용한 방법이다.

Keywords

References

  1. 최원석, 이동우, 김문식, 나종화, "음성인식 및 영상처리 기반 멀티모달 입력장치의 설계", 제어.로봇.시스템학회 논문지, Vol. 13, No. 8, pp.743-748, 2007
  2. 정보통신산업진흥원, "모바일과 클라우드로 재조명받는 '음성인식'", 주간기술동향, 1520호, 2011년 11월
  3. 한국콘텐츠진흥원, "음성인식기술의 동향과 전망", 문화기술(CT) 심층리포트, 2011년 11월
  4. 안종영, 김상범, 김수훈, 허강인, "모델적응 HMM을 이용한 모바일 환경에서의 음성인식에 관한 연구", 한국인터넷방송통신학회 논문지, Vol. 11, No. 3, 2011
  5. L. R. Rabiner, "A tutorial on hidden Markov models and selected applications in speech recognition", Proceedings of the IEEE, Vol. 77, No. 2, pp. 257-286, 1989 https://doi.org/10.1109/5.18626
  6. Sangyeob Lee, Whoiyul Kim, "Robust Character Image Retrieval Method Using Bipartite Matching and Pseudo-bipartite Matching", Proceedings of the First International Workshop on Advanced Internet Services and Applications (AISA), London, UK, 2002
  7. S. Sclaroff and A. P. Pentland, "Search by Shape Examples: Modeling Nonrigid Deformation", Proceedings of 28th Asilomar Conference on Signals, Systems, and Computers, pp.1341-1344, October 1994
  8. SangYeob Lee, Whoi-Yul Kim, "Robust Character Image Retrieval Method Using Bipartite Matching," LNCS 2402, pp. 295-306, 2002
  9. 이상엽, 김회율, "Bipartite Matching 을 이용한 강인한 캐릭터 영상 검색 방법," 방송공학회 논문지 Vol.7, No.2, pp. 136-143 June 2002.
  10. Whoi-Yul Kim and C. Kak, "3-D Object Recotnition Using Bipartite Matching Embedded in Discrete Relaxation," IEEE Trans. Pattern Anal. Machine Intell., vol. 13, no.3, pp. 224-251
  11. J. Canny, "A computational approach to edge detection," IEEE Trans. Pattern Anal. Machine Intell., vol. PAMI-8, pp. 679-698, Nov. 1986 https://doi.org/10.1109/TPAMI.1986.4767851