VCOR를 이용한 효율적인 어휘 최적화 관리

Efficient Vocabulary Optimization Management using VCOR

  • 오상엽 (경원대학교 IT대학 컴퓨터소프트웨어)
  • 투고 : 2010.03.22
  • 심사 : 2010.10.07
  • 발행 : 2010.10.30

초록

어휘 인식 시스템에서는 처리되는 어휘가 나타나지 않는 미 출현 트라이 폰이 존재하는 단점이 있으며 이에 따른 신뢰도의 분포를 가지고 있지 않기 때문에 정규화를 수행할 수 없다. 따라서 이를 개선하기 위하여 미등록어 거절 알고리즘에서 사용되는 어휘 관리를 최적화하고 음소 단위로 데이터 탐색을 지원하는 VCOR 시스템을 제안한다. 또한 VCOR에서는 어휘 정보를 효율적으로 제공하기 위해 확장 facet 분류를 이용하여 사용자에게 어휘 단위의 정보를 제공하고, 어휘에 대한 향상된 추적 관리 가능을 제공하여 어휘에 대한 인식의 정확성을 제공한다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 97.56%, 어휘 독립 인식률은 96.23%의 인식률을 나타내었다.

In vocabulary recognition system has it's bad points of processing vocabulary unseen triphone and then no got distribution of confidence measure by cannot normalization. According to this problem to improve suggested VCOR(Version Control for Out-of Rejection) system by out-of vocabulary rejection algorithm use vocabulary management optimization and then phone data search support. In VCOR system to provide vocabulary information efficiently offering for user's vocabulary information using extend facet classification that improved for vocabulary measure management function offering accuracy of recognition for vocabulary. In this paper proposed system performance as a result of represent vocabulary dependence recognition rate of 97.56%, vocabulary independence recognition rate of 96.23%.

키워드

참고문헌

  1. 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템," 한국컴퓨터정보학회논문지, 제 14권, 제 10호, 217-223쪽, 2009년 10월.
  2. Yeonja Lim and Youngjik Lee, "Implementation of the POW (Phonetically Optimized Words) algorithm for speech database," Proc. of ICASSP, pp.89-91, 1995.
  3. 최승호, "정규화 신뢰도 기반 가변어휘 고립단어 인식기의 거절기능 성능 분석", 한국음향학회지, 제25권, 제2호, pp.96-99, 2006년.
  4. D. Jurafsky and J. H. Martin, "Speech and Language Processing," Prentice-Hall, pp.21-157, 2000.
  5. 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 대한전자공학학회논문지, 제43권, 제6호, 496-504쪽, 2006년.
  6. M. G. Rahim, C. H. Lee, B. H. Juang and W. Chou, "Discriminative utterance verification using minimum string verification error (MSVE) training." Proc. of ICASSP 96, pp. 3585-3588, 1996.
  7. 오상엽, 김홍진, 김영선, "UML을 이용한 컴포넌트 버전 제어 시스템 설계," 한국컴퓨터정보학회논문지, 제8권 제1호, 69-75쪽, 2003년 3월.
  8. A. S. Manos and V. W. Zue, "A study on out-of- vocabulary word modeling for a segment-based keyword spotting system," Master Thesis, MIT, pp. 19-53, 1996.
  9. 김덕현, 박성주, "확장된 객체지향 데이터 모형을 이용한 소프트웨어 변경 관리 시스템," 한국정보과학회논문지, 제 22권 제 2호, 249-260쪽, 1995년.
  10. 오상엽, 최우승, "버전제어에서 컴포넌트의 형상형성 제어를 위한 객체지향 라이브러리," 한국컴퓨터정보학회논문지, 제13권, 제6호, 51-58쪽 2008년 11월.
  11. 박서영, 김갑수, 명선영, 신영길, 우치수, "객체지향 패러다임에서의 소프트웨어 컴포넌트 분류에 관한 연구," 한국정보과학회논문지, 제20권, 제2호, 879-882쪽, 1993년.
  12. L. R. Bahl, P. V. deSouza, P. S. Gopalakrishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," In Proc. IEEE ICASSP-92, Vol. 1, pp.17-21, 1992.
  13. L. R. Rabiner and B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, pp.18-181, 1993.
  14. K. Demuynck, J. Duchateau, and D. Van Compemolle, "A static lexicon network representation for cross-word context dependent phones," In Proc. EUROSPEECH, Vol. 1, pp.143-146, 1997.
  15. T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp.217-220, 1998.
  16. 김철, 이경록, 김진영, 최승호, 최승호, "정규화 신뢰도를 이용한 핵심어 검출 성능향상," 한국음향학회지, 제21권, 제4호, pp. 380-386, 2002년.
  17. 김행곤, "소프트웨어 재사용 지원 정보 저장소 구축," 한국정보과학회.정보처리학회 공동 특집호, 제24권 제11호, 14-31쪽, 2006년 11월.
  18. R. Helm and Y. S. Maarek, "Integrating Information Retrieval and Domain Specific Approaches for Browsing and Retrieval in Object Oriented Class Libraries," Proceeding of OOPSLA' 91, pp.47-61, 1991.
  19. S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher and P. Woodland, "The HTK Book," Cambridge University Engineering Department, pp.17-81, 2002.