A Study on the Segmentation and Labeling of telephone-based Speech

전화 음성의 Segmentation 및 Labeling에 관한 연구

  • 어범석 (광운대학교 컴퓨터공학과) ;
  • 최갑근 (광운대학교 컴퓨터공학과) ;
  • 김학진 (광운대학교 컴퓨터공학과) ;
  • 김순협 (광운대학교 컴퓨터공학과)
  • Published : 2000.09.01

Abstract

상용 가능한 대규모 음성인식 시스템의 개발을 위해서는 음성 데이터베이스 구축이 중요한 과제의 하나로써, 많은 시간과 노력이 요구되며 특히 세그멘테이션과 라벨링은 그 노력의 상당부분이 된다. 본 논문은 ARS 주식 거래 시스템에서 사용되는 대용량 음성 DB의 효과적 구축을 위해 세그멘테이션 및 라벨링의 자동화에 대한 연구를 하였다. 본 연구를 위해 20대 성인 남녀를 대상으로 증권거래와 관련한 15개의 문장을 발성하도록 하였으며 Dialogic사의 D/41ESC보드를 장착하고, Window NT4.0 플렛폼에서 음성을 수집하였다. 또한 자동 Segmentation과 labeling은 Aligner를 사용하였으며 수동과 비교하기 위해 CSLU speech Tool Kit을 사용하였고 수작업은 숙련도가 있는 전문가가 하도록 하였다.

Keywords