• 제목/요약/키워드: Pitch number information

검색결과 40건 처리시간 0.03초

음고 개수 정보 활용을 통한 기계학습 기반 자동악보전사 모델의 성능 개선 연구 (A study on improving the performance of the machine-learning based automatic music transcription model by utilizing pitch number information)

  • 이대호;이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.207-213
    • /
    • 2024
  • 본 논문은 기계학습 기반 자동악보전사 모델의 입력에 음악적인 정보를 추가하는 방법을 통해 원하는 성능 향상을 얻는 방법을 다루었다. 여기서, 추가한 음악적인 정보는 각 시간 단위마다 발생하는 음고 개수 정보이며, 이는 정답지에서 활성화되는 음고 개수를 세는 방법으로 획득한다. 획득한 음고 개수 정보는 기존 모델의 입력인 로그 멜-스펙트로그램 아래에 연결하여 사용했다. 본 연구에서는 네 가지 음악 정보를 예측하는 네 종류의 블록이 포함된 자동악보전사 모델을 사용하였으며, 각 블록이 예측해야하는 음악 정보에 해당하는 음고 개수 정보를 기존의 입력에 추가해주는 간단한 방법이 모델의 학습에 도움이 됨을 확인했다. 성능 개선을 검증하기 위하여 MIDI Aligned Piano Sounds(MAPS) 데이터를 활용하여 실험을 진행하였으며, 그 결과 모든 음고 개수 정보를 활용할 경우 프레임 기준 F1 점수에서 9.7 %, 끝점을 포함한 노트 기준 F1 점수에서 21.8 %의 성능 향상을 확인하였다.

보코더에서 서브프레임 수의 변화를 이용한 피치검색 성능 개선에 관한 연구 (A Study on Improving Pitch Search by Varying the number of Subframes for Vocoder)

  • 백금란;배명진
    • 전자공학회논문지
    • /
    • 제49권10호
    • /
    • pp.83-88
    • /
    • 2012
  • 보코더에서의 피치 검색 과정은 매우 중요하다. 일반적으로 먼저 신호의 주기성을 강조한 후 피치를 검색하는 방법을 주로 사용한다. 프레임 내에서 두 개의 펄스 간격을 변화시켜 가며 신호와의 상관관계를 구하는 것으로 상관관계 값이 가장 높을때가 주기가 가장 두드러지는 반복 구간이므로 이때 의 펄스 간격을 피치 주기로 찾는다. 그러나 프레임 내에서의 신호의 진폭이 일정하지 않고 갑자기 변하는 구간이 있는 경우 정확하지 않는 피치가 얻어진다. 이를 해결하기 위해 프레임을 여러 개의 서브프레임으로 다시 나누어 피치를 검색하는 방법을 사용하고 있는데 이 방법은 피치를 정확하게 검색할 수 있지만 계산량이 많아진다. 본 논문에서는 프레임의 에너지 비율로 프레임 내의 진폭 변화율을 예측하여 서브프레임 수를 가변시키는 방법을 제안한다. 이 방법들을 적용하면 합성 음질에는 영향을 주지 않는 상태에서 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능 개선이 된다.

피치 검출과 퍼지화 패턴을 이용한 숫자음 화자 인식에 관한 연구 (A Study on Number sounds Speaker recognition using the Pitch detection and the Fuzzified pattern)

  • 김연숙;김희주;김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.73-79
    • /
    • 2003
  • 본 논문에서는 피치 검출과 퍼지화 패턴 매칭을 포함하는 화자 인식 알고리즘을 제안한다. 음의 개성을 표현하는 피치를 이용한 피치 패턴을 사용하고 음성의 파라미터는 2진화 스펙트럼을 사용한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함할 수 있도록 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지화 패턴 매칭을 이용하여 인식을 수행한다.

  • PDF

영어 뉴스와 자연발화에 나타나는 고성조 피치액센트의 차이점 (Differences in High Pitch Accents between News Speech and Natural Speech)

  • 최윤희;이주경
    • 음성과학
    • /
    • 제12권2호
    • /
    • pp.17-28
    • /
    • 2005
  • This paper argues that news speech entails a distinct intonational pattern from natural speech, effectively reflecting that it primarily focuses on providing new information. We conducted a phonetic experiment to compare the tonal contours between news speech and natural speech, examining the distributions of pitch accents and the overall pitch ranges. We utilized 70 American Press (AP) radio news utterances and 70 natural utterances extracted from TV dramas. Results show that news speech involves 3.38 H*'s (including L+H* and !H*) within an intonational phrase (IP) or intermediate phrase (ip) whereas natural speech, 1.8 in average. The number of IP/ip's per sentence is 3 in news speech, which is shown in the highest rate of 32.07% of the news speech, but it is merely 1, taking up the highest 41.42% in natural speech. Next, declination tends to be prevented in news speech, and the pitch range is much greater in news speech than in natural speech. Finally, a secondary stress syllable is comparatively frequently given a pitch accent in news speech, explicitly distinct from natural speech. These results can be interpreted as stating that news has the particular purpose of providing new information; every content word tends to be given a H* or its related pitch accent like L+H* or !H* because news speech assumes that every word conveys new information. This definitely brings about more IP/ip's per sentence due to a human physiological constraint; that is, more H*'s will cause more respiratory breaks. Also, greater pitch ranges and pitch accents imposed on secondary stress may be attributed to exaggerating new information.

  • PDF

국부 봉우리와 골에 의한 피치 검출과 퍼지를 이용한 화자 인식에 관한 연구 (A Study on Speaker Recognition using the Peak and valley pitch detection and the Fuzzy)

  • 김연숙;김희주;김경재
    • 한국정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.213-219
    • /
    • 2004
  • 본 논문에서는 국부 봉우리와 골에 의한 피치 파라미터와 퍼지를 포함한 화자 인식 알고리즘을 제안한다. 음성의 패턴 인식에서 인식 성능을 저하시키는 시간 변동과 주파수 변동에 대한 문제를 해결하여 피치를 검출한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함하기 위하여 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지 패턴 매칭을 이용하여 인식을 수행한다.

한국어 단모음의 성별, 연령별 특징변화 및 인식 (Changes in Features of Korean Vowels with Age and Sex of Speakers and Their Recognition)

  • 이용주;김경태;차균현
    • 대한전자공학회논문지
    • /
    • 제25권12호
    • /
    • pp.1503-1512
    • /
    • 1988
  • As the basic analysis to solve the within-and cross-speaker variability in phoneme based speech recognition, changes in pitch and formant frequencies of 8 Korean vowels with age and sex of speaker has been investigated by analyzing a large number fo samples. Conclusions obtained are as follows: 1) Changes in pitch frequency with age and sex of speaker for children are hard to distinguish and the difference of before and after the voice change is analyzed approximately 0.2 oct. for female an 0.9 oct. for male. 2) While most of the formants of vowel considerably change with the age of speaker, the change becomes smaller as the age becomes older. 3) While there is an indirect correlation between pitch and formant with change in age, it is hard to see a direct correlation. 4) When the objects of the recognition experiment by pitch and formants are various speakers in each age and sex, pitch also works as an efficient recognition parameter.

  • PDF

선형 보간법을 이용한 시간과 주파수 조합영역에서의 피치 추정 방법 (Pitch Estimation Method in an Integrated Time and Frequency Domain by Applying Linear Interpolation)

  • 김기출;박성주;이석필;김무영
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.100-108
    • /
    • 2010
  • 본 논문은 피치를 추출하는 방법으로 자기상관을 이용하였다. 시간과 주파수 영역의 자기상관은 서로 다른 특성을 가지고 있으며, 각각 피치주기와 기본주파수에 대응된다. 본 논문에서는 시간과 주파수 영역에서의 자기상관을 결합하는 방법을 이용하였다. 이 방법은 자기상관에서 발생하는 피치 doubling과 having 에러를 크게 개선시킬 수 있었다. 하지만, 시간과 주파수 영역에서 유성음의 주기적 특성인 피치주기와 기본주파수는 서로 역수 관계이며, 특히 기본주파수의 에러는 FFT의 분해능에 의하여 발생된다. 이러한 영향을 줄이기 위하여 시간 영역과 주파수 영역에서의 자기상관 결합에 보간법을 적용함으로써 피치 검출율을 향상 시킬 수 있었다. 자기상관을 결합할 때 시간영역에서 찾은 피치후보들에 대해서만 주파수영역의 자기상관을 구함으로써 계산량은 감축될 수 있었다. 또한, 선형보간을 이용하여 기존방법 보다 FFT 계수를 8배 줄일 수 있었다. 그 결과, FFT 연산량과 주파수영역의 자기상관 계산량을 크게 감축하여 기존 방법 대비 알고리즘 처리시간을 약 9.5배 줄일 수 있었다.

Pitch Shifting 기법을 사용하는 전자악기에서 Sample Module의 개수를 최소화하는 방안 (The method to minimize the number of sample modules in the electronic musical instrument using pitch shifting technique)

  • 박진원;최제헌;김규년
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.439-441
    • /
    • 2001
  • 현재 사용되고 있는 전자악기는 한 옥타브에 대해 여러 개의 샘플 모듈(sample module)을 메모리에 저장해두면서, 옥타브내의 다른 음들은 그 샘플 모듈을 피지 시프팅(pitch shifting)하여 생성한다[1]. 따라서, 하나의 악기에 대해 많은 샘플 모듈을 사용하게 되고 많은 메모리를 필요로 한다. 본 논문에서는 보다 적은 샘플 모듈을 사용하여 메모리를 절약할 수 있는 방법을 연구하였다. 피치 시프팅의 범위를 하나의 옥타브 이내로 제한하지 않고, 피치 시프팅에 의해 발생하는 원음과 오차 평균을 줄이면서 가장 적절한 샘플 모듈음을 찾아낸다. 본 논문에서는 전자악기의 악기음 중에서 피아노 음을 선택했으며, 피아노의 88개 음들 중에서 피치 시프팅을 했을 때 원음과 가장 가까운 음을 만들어내는 음들을 샘플 모듈로 사용한다. 이러한 방법으로 샘플 모듈음들을 선택하면 기존의 전자악기에서 사용하는 샘플 모듈 개수보다 훨씬 적으면서도 동일한 음질을 보장하고, 또한 메모리 공간도 절약할 수 있다.

  • PDF

유도탄 제어기의 이득-스케듈링에 관한 연구 (A study on the gain-scheduling of missile autopilot)

  • 송찬호;김윤식
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1991년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 22-24 Oct. 1991
    • /
    • pp.355-360
    • /
    • 1991
  • A method of autopilot gain-scheduling is presented for missiles which have heavy aerodynamic coupling between pitch and yaw channels due to high maneuverability. Pitch and yaw, autopilot are cross-coupled, and their feedback gains are scheduled by total acceleration and bank angle for given Mach number and height. Bank angle information is obtained by using a simple estimator. By computer simulation, it is shown that the proposed method is superior to other existing methods.

  • PDF

보코더에서 피치검색 성능개선에 관한 연구 (A Study on Improving Pitch Search for Vocoder)

  • 백금란;배명진
    • 한국음향학회지
    • /
    • 제31권7호
    • /
    • pp.419-426
    • /
    • 2012
  • 보코더 에서 의 피치 분석 과정은 매우 중요하다. 일반적으로 먼저 신호의 주기성을 강조한 후 피치를 검색하는 방법을 주로 사용한다. 프레임 내에서 두 개의 펄스 간격을 변화시켜가며 신호와의 상관관계를 구하는 것으로 상관관계 값이 가장 높을 때가 주기가 가장 두드러지는 반복 구간이므로 이때 의 펄스 간격을 피치 주기로 찾는다. 그러나 찾아진 주기가 반주기, 배주기 및 세배주기인 경우에는 이 간격을 피치 주기라 할 수 없어 이를 해결하기 위한 여러 가지방법들이 제안되어있다. 또한 프레임 내에서의 신호의 진폭이 일정하지 않고 갑자기 변하는 구간이 있는 경우 정확하지 않는 피치가 얻어진다. 이를 해결하기 위해 프레임을 여러 개의 서브프레임으로 다시 나누어 피치를 검색하는 방법을 사용하고 있는데 이 방법은 피치를 정확하게 검색할 수 있지만 계산 량이 많아진다. 본 논문에서는 위에 제시한 두 가지 문제점을 개선하기 위한 알고리즘을 제안한다. 첫째 반주기, 배주기 및 세배주기를 줄이기 위해 피치를 검색하기 전에 프레임 내의 전체 에너지변화 비율을 추정하여 신호의 에너지 레벨을 미리 보상해 준 후 피치를 검색하는 방법을 제안한다. 둘째, 이렇게 구한 에너지 비율로 프레임 내의 진폭 변화율을 예측하여 서브프레임 수를 가변시키는 방법을 제안한다. 이 방법들을 적용하면 합성 음질에는 영향을 주지 않는 상태에서 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능 개선이 된다.