DOI QR코드

DOI QR Code

Implementation of Music Signals Discrimination System for FM Broadcasting

FM 라디오 환경에서의 실시간 음악 판별 시스템 구현

  • 강현우 (강남대학교 컴퓨터미디어공학부)
  • Published : 2009.04.30

Abstract

This paper proposes a Gaussian mixture model(GMM)-based music discrimination system for FM broadcasting. The objective of the system is automatically archiving music signals from audio broadcasting programs that are normally mixed with human voices, music songs, commercial musics, and other sounds. To improve the system performance, make it more robust and to accurately cut the starting/ending-point of the recording, we also added a post-processing module. Experimental results on various input signals of FM radio programs under PC environments show excellent performance of the proposed system. The fixed-point simulation shows the same results under 3MIPS computational power.

본 연구에서는 GMM 기반의 음성/음악 판별 방법을 응용하여 FM 라디오 방송에서 순수한 음악 구간만을 판별하는 시스템을 구현하였다. 본 시스템에서는 음성, 음악, 광고 음악, 기타 여러 가지 사운드가 혼합되어 있는 오디오 방송 프로그램에서 순수한 음악만을 판별하여 자동으로 저장하고자 한다. 음악의 시작 부분과 끝 부분을 보다 정교하게 검출하고자 순수한 음악으로 판별된 구간의 시작 부분과 끝 부분에 대해 후처리 과정을 추가하였다. PC 환경에서 FM 라디오 방송을 이용하여 구현된 시스템을 실시간으로 테스트한 결과 우수한 성능을 보임을 확인하였다. 또한 SoC 구현을 고려하여 고정소수점 연산을 수행한 결과 3MIPS 이하의 적은 연산량으로 부동소수점 연산일 때와 동일한 결과를 얻을수 있었다.

Keywords

References

  1. W. Q. Wang, W. Gao, D. W. Ying, 'A Fast and Robust Speech/Music Discrimination Approach,' IEEE ICICSPCM, pp.1325-1329, Dec., 2003
  2. Lie Lu, Hong-Jiang Zhang, Hao Jiang, 'Content analysis for audio classification and segmentation,' IEEE Transactions on Speech and Audio Processing, Vol.10, No.7, pp.504-516, Oct., 2002 https://doi.org/10.1109/TSA.2002.804546
  3. K. El-Maleh, M. Klein, G. Petrucci, P. Kabal, 'Speech/Music Discrimination for Multimedia Application', Proc. IEEE Int. Acoustics, Speech, Signal Processing, Istanbul, pp.2445-2448, Jun., 2000
  4. 정기훈, 이봉진, 강현우, 강홍구, '음악/음성 판별 시스템의 특성 파라미터 조합에 따른 성능 분석,' 음향학회 추계학술발표대회논문집, 제25권, 제2(s)호, pp.247-250, 2006년 11월
  5. Thom F. Quatieri, Discrete-Time Speech Signal Processing Principles and Practice, Prentice Hall PTR, 2002
  6. Rongqing Huang, 'Advances in Unsupervised Audio Classification and Segmentation for the Broadcast News and NGSW Corpora,' IEEE Transactions on Speech and Audio Processing, Vol.14, No.3, pp.907-919, May, 2006 https://doi.org/10.1109/TSA.2005.858057
  7. Reynolds, D. A. Rose, R. C, 'Robust Text-independent Speaker Identification using Gaussian Mixture Speaker Models', IEEE Transaction on Speech and Audio Processing, Vol.3, No.1, pp.72-83, Jan., 1995 https://doi.org/10.1109/89.365379
  8. 신옥근, '화자독립 음성인식을 위한 GMM 기반 화자 정규화,' 정보처리학회논문지, Vol.12-B, No.4, pp.437-442, Aug., 2005 https://doi.org/10.3745/KIPSTB.2005.12B.4.437
  9. Costas Panagiotakis and George Tziritas, 'A Speech/Music Discriminator based on RMS and Zero-Crossings,' IEEE Transactions on Multimedia, Vol.7, No.1, pp.155-166, Feb., 2005 https://doi.org/10.1109/TMM.2004.840604
  10. ITU-T Software Tool Library 2000, STL-2000. Release 3 version, http://www.itu.int/rec/T-REC-G.191-200012-S/en