Selection of Personalized Head Related Transfer Function Using a Binary Search tree

이진 탐색 트리를 이용한 개인화된 머리 전달 함수의 탐색

  • 이기승 (건국대학교 정보통신대학 전자공학부) ;
  • 이석필 (전자부품연구원 방송통신융합 연구센터)
  • Published : 2009.07.31

Abstract

The head-related transfer function (HRTF), which has an important role in virtual sound localization has different characteristics across the subjects. Measuring HRTF is very time-consuming and requires a set of specific apparatus. Accordingly, HRTF customization is often employed. In this paper, we propose a method to search an adequate HRTF from a set of the HRTFs. To achieve rapid and reliable customization of HRTF, all HRTFs in the database are partitioned, where a binary search tree was employed. The distortion measurement adopted in HRTF partitioning was determined in a heuristic way, which predicts the differences in perceived sound location well. The DC-Davis CIPIC HRTF database set was used to evaluate the effectiveness of the proposed method. In the listening test, where 10 subjects were participated, the stimuli filtered by the HRTF obtained by the proposed method were closer to those by the personalized HRTF in terms of sound localization. Moreover, performance of the proposed method was shown to be superior to the previous customization method, where the HRFT is selected by using anthropometric data.

가상 음원의 공간화에 중요한 역할을 담당하는 머리전달 함수는 개인 별로 각기 다른 특성을 갖는다. 개인화된 머리 전달 함수를 얻기 위해서는 많은 시간과 특정한 장치를 필요로하며, 이에 따라 타인으로부터 얻어진 머리 전달 함수를 청취자의 특성에 맞도록 개인화 시키는 방법이 주로 사용된다. 본 논문에서는 머리 전달 함수의 개인화 방법으로 여러 개의 미리 측정된 머리 전달 함수 중에서 사용자에 가장 적합한 머리 전달 함수를 찾는 방법을 제안하였다. 제안된 방법은 청취자에게 적합한 머리 전달 함수를 빠르고 정확하게 찾기 위해 이진 탐색 트리를 이용한 분할 기법을 사용하였다. 분할 시 왜곡 척도는 사람이 귀에 방향감의 차이를 가장 잘 인지하는 왜곡 척도를 실험적으로 결정하였다. 캘리포니아 데이비스 대학에서 제공하는 CIPIC 머리 전달 함수 데이터 베이스를 이용하여 본 기법의 유용성을 평가하였다. 10명의 실험자가 참여한 청취 테스트에서 제안된 기법을 통해 탐색된 머리 전달 함수는 청취자 본래의 머리 전달 함수와 비교하여 가상 음원의 방향감에 있어서 매우 근접한 결과를 나타내었으며, 기존의 해부학적인 파라메터를 이용한 머리 전달 함수의 탐색 기법과 비교하여 우수한 성능을 나타내었다.

Keywords

References

  1. J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization, MIT Press, Cambridge, MA, 1983
  2. D. R. Begault, 3D sound for virtual reality and multimedia, Academic Press, Cambridge, MA, ch. 4, pp. 132-136, 1994
  3. J. C. Middlebrooks, “lndividual differences in external-ear transfer functions reduced by scaling in frequency,” J. Acoust. Soc. Am., vol. 106, no. 3, pp. 1480-1492, 1999 https://doi.org/10.1121/1.427176
  4. S.-L. Lee, L-H. Kim and S.-M. Sung, "Head related transfer function refinement using directional weighting function," AES $115^{th}$ Convention, paper no. 5918, Oct. 2003
  5. M. Zhang, K.-C, Tan and M. H. ER, "Three-mensional sound synthesis based on head-related transfer functions," J. Audio Eng. Soc., vol. 46, no. 10, pp. 836-844, 1998
  6. H. Hu, L. Chen and Z. Wu, "The estimation of personalized HRTFs in individual VAS," in Proc. IEEE $4^{th}$ International Conference on Natural Communication, pp. 203-207, Oct, 2008 https://doi.org/10.1109/ICNC.2008.460
  7. D. N. Zotkin, R. Duraiswami and L S. Davis, "Rendering localized spatial audio in a virtual auditory space," IEEE Trans. Multimedia, vol. 6, no. 4, pp. 553-564, 2004 https://doi.org/10.1109/TMM.2004.827516
  8. S. Hwang and Y. Park, "HRIR customization in the median plane via principal components analysis," AES $31^{st}$ Con-vention, paper no. 9, June, 2007
  9. CIPIC HRTF Database Files, Release 1.0, http://interface.cipic.ucdavis.edu., 2001
  10. Brieman, Friedman, Olsen and Stone, Classification and Regression Trees, Wadsworth, Balmont CA, 1984
  11. R. Nicol, V. Lemaire, A. Bondu and S. Busson, "Looking for a relevant similarity criterion br HRTF clustering: a com-parative study", AES $120^{th}$ Convention, paper no. 6653, May. 2006
  12. S. Shimada, N. Hayashi and S. Hayashi, "A clustering method for sound localization transfer functions", J. Audio Eng. Soc., Vol. 42, no. 7/8, pp. 577-584, 1994
  13. 이기승, 이석필 "머리전달 함수의 보간에 적합한 왜곡 척도," 한국음향학회지, 28권, 2호, 85-95쪽, 2009
  14. D. D. Rife and J. Vanderkooy, "Transfer-Function Measure-ments using Maximum- Length Sequences", J. Audio Eng. Soc., vol. 37, no. 6, pp. 419-444, 1989
  15. KEMAR HRTF data, ftp://sound.media.mit.edu/pub/Data/KEMAR, 1994