DOI QR코드

DOI QR Code

Development of User Music Recognition System For Online Music Management Service

온라인 음악 관리 서비스를 위한 사용자 음원 인식 시스템 개발

  • 성보경 (숭실대학교 미디어학과) ;
  • 고일주 (숭실대학교 IT대학 글로벌미디어학부)
  • Received : 2010.06.12
  • Accepted : 2010.09.09
  • Published : 2010.11.30

Abstract

Recently, recognizing user resource for personalized service has been needed in digital content service fields. Especially, to analyze user taste, recommend music and service music related information need recognition of user music file in case of online music service. Music related information service is offered through recognizing user music based on tag information. Recognition error has grown by weak points like changing and removing of tag information. Techniques of content based user music recognition with music signal itself are researched for solving upper problems. In this paper, we propose user music recognition on the internet by extracted feature from music signal. Features are extracted after suitable preprocessing for structure of content based user music recognition. Recognizing on music server consist of feature form are progressed with extracted feature. Through this, user music can be recognized independently of tag data. 600 music was collected and converted to each 5 music qualities for proving of proposed recognition. Converted 3000 experiment music on this method is used for recognition experiment on music server including 300,000 music. Average of recognition ratio was 85%. Weak points of tag based music recognition were overcome through proposed content based music recognition. Recognition performance of proposed method show a possibility that can be adapt to online music service in practice.

최근 디지털 콘텐츠 서비스 분야에서 사용자 맞춤형 서비스를 위해 사용자 자원 인식의 필요성이 대두되고 있다. 특히 온라인 기반 음악 서비스의 경우 사용자 취향 분석, 음원 추천 및 음악 관련 정보 제공을 위해 사용자 음원인식 기술이 요구되고 있다. 현재 태그정보를 기초로 사용자 음원 인식 후 음악 관련 정보를 제공하는 서비스가 제공되고 있지만, 태그정보의 변조 및 삭제 등의 취약점으로 인식 오류가 급증하고 있다. 이러한 문제의 보완 방안으로 음악 자체를 이용하는 내용기반 사용자 음원 인식 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보를 기초로 온라인상에서 사용자 음원을 인식하는 방법에 대해 논하고자 한다. 사용자 음원의 내용기반 인식을 위해 구조에 적합한 음원의 전처리 후 특징 추출을 하였다. 추출된 특징은 음악 서버에 특징 형태로 저장된 음원과의 매칭 과정을 통한 인식을 진행하여 태그데이터에 독립적으로 사용자 음원을 인식할 수 있게 되었다. 제안된 사용자 음원 인식 방법의 검증을 위해 600개의 음악을 무작위 선정하고, 각각을 5가지 음질로 변화하였다. 이렇게 생성된 3000개의 실험음원을 30만곡을 포함하는 음악 서버를 기준으로 인식실험을 진행하였다. 평균 인식율은 85%를 나타내었다. 제안하는 내용기반 음원 인식을 통하여 태그기반 음원 인식의 취약점에 대한 극복을 하였으며, 음원 인식의 성능은 실제 온라인 음악 서비스에 적용할 가능성을 보여주었다.

Keywords

References

  1. ID3 tag version 2.3.0, http://www.id3.org/id3v2.3.0.html
  2. 성보경, 김정수, 고일주, "음악특징점간의 유사도 측정을 이용한 동일음원 인식 방법," 한국컴퓨터정보학회논문지, 제 13권, 제 3호, 99-106쪽, 2008년 5월.
  3. R. Zhou and J. D. Reiss, "Music Onset detection combining energy-based and pitch-based approaches," Proc. MIREX Audio Onset Detection Contest, 2007.
  4. A. J. eronen, V. T. Peltonen, J. T. Tuomi, A. P. Klapuri, S. Fagerlund, T. Sorsa, G. Lorho and J. Huopaniemi, "Audio-Based Contest Recognition," IEEE Trans. Audio, Speech and Language processing, vol. 14, no. 1, pp. 321-329, Jan. 2006. https://doi.org/10.1109/TSA.2005.854103
  5. A. Harma, UK.Laine, "A comparison of warped and conventional linear predictive coding," IEEE Transactions on Speech and Audio Processing, Vol.9, No.5, pp.579-588, 2001. https://doi.org/10.1109/89.928922
  6. J. Makhoul, "Linear prediction-A tutorial overview," Proceeding of IEEE, Vol.63, No.4, pp.561-580, 1975. https://doi.org/10.1109/PROC.1975.9792
  7. B.J. Shannon, K.K. Paliql, "A comparative study of filter bank spacing for speech recognition," Proceedings of International Micro-electronic engineering research conference, pp.1-3, Brisban, Austria, 2003.
  8. F. Zheng, G. Zhang, "Integrating the energy information into MFCC," 6th International Conference of Spoken Language Processing, Vol.1, pp.389-392, Beijing. China, 2000.
  9. Z. Jun, S. Kwong, W. Gang, Q.Hong. "Using Mel-Frequency Cepstral Coefficients in Missing Data Technique," EURASIP Journal on Applied Signal Processing, Vol.2004, No.1, pp.340-346, 2004. https://doi.org/10.1155/S1110865704309030
  10. M. Xu, NC. Maddage, C. Xu, M. Kankanhalli, Q. Tian, "Creating audio keywords for event detection in soccer video," Multimedia and Expo. ICME03 Proceedings, Vol.2, pp.281-284, 2003.
  11. R. Vergin, Oapos, D. Shaughnessy, A. Farhat, "Generalized mel frequency cepstral coefficients for large-vocabulary speaker-independent continuous-speech recognition," IEEE Transactions on Speech and Audio Processing, Vol.7, No.5, pp.525-532, 1999 https://doi.org/10.1109/89.784104
  12. JJ. Burred, A. Lerch, "A hierarchical approach to automatic musical genre classification," Proceeding of 6th International Conference on Digital Audio Effects, pp.DAFX1-DAFX4, London, UK, 2003.
  13. L. Lu, HJ. Zhang, H. Jiang, "Content analysis for audio classification and segmentation," IEEE Transactions on Speech and Audio Processing, Vol.10, No.7, pp.504-516, 2002. https://doi.org/10.1109/TSA.2002.804546
  14. E. Scheirer, M.Slaney, "Construction and evaluation of a robust multifeature," Acoustics, Speech, and Signal Processing ICASSP-97 IEEE, Vol.2, pp.1331-1334, 1997.
  15. SH. Nawab, TF. Quatieri, "Short-time Fourier transform," Advanced topics in signal processing of Prentice Hall Signal Processing Series, pp.289-337, 1987.
  16. B.K. Sung, I.J. Ko, "A Practical Method for Digital Music Matching Robust to Various Sound Qualities," Proceedings of World Academy of Science, Engineering And Technology (WASET) Vol.60, Conference on Computer, Electrical, Systems Science and Engineering 2009 (CESSE2009), pp.309-314, Bangkok, Thailand, December 2009.
  17. B.K. Sung, I.J. Ko, "Effective Digital Music Retrieval System through Content-based Features," Proceedings of World Academy of Science, Engineering And Technology (WASET) Vol.50, International Conference on Computer, Electrical, Systems Science and Engineering 2009 (ICSSE2009), pp.721-726, Penang, Malaysia, February 2003.
  18. 김정수, 성보경, 구광효, 고일주, "노이즈에 강인한 음악 시작점 검출 알고리즘," 한국컴퓨터정보학회논문지, 제 14권, 제 9호, 95-104쪽, 2009년 9월.

Cited by

  1. Analysis and Evaluation of Multi-view UCV(User Created Video) Service through Adjusting Camera Angle vol.14, pp.2, 2014, https://doi.org/10.5392/JKCA.2014.14.02.039