DOI QR코드

DOI QR Code

A Study on VoiceXML Application of User-Controlled Form Dialog System

사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구

  • 권형준 (성균관대학교 대학원 정보통신공학부) ;
  • 노용완 (성균관대학교 대학원 정보통신공학부) ;
  • 이현구 (서일대학교 정보기술계열 정보통신) ;
  • 홍광석 (성균관대학교 정보통신공학부)
  • Published : 2007.06.30

Abstract

VoiceXML is new markup language which is designed for web resource navigation via voice based on XML. An application using VoiceXML is classified into mutual-controlled and machine-controlled form dialog structure. Such dialog structures can't construct service which provide free navigation of web resource by user because a scenario is decided by application developer. In this paper, we propose VoiceXML application structure using user-controlled form dialog system which decide service scenario according to user's intention. The proposed application automatically detects recognition candidates from requested information by user, and then system uses recognition candidate as voice-anchor. Also, system connects each voice-anchor with new voice-node. An example of proposed system, we implement news service with IT term dictionary, and we confirm detection and registration of voice-anchor and make an estimate of hit rate about measurement of an successive offer from information according to user's intention and response speed. As the experiment result, we confirmed possibility which is more freely navigation of web resource than existing VoiceXML form dialog systems.

VoiceXML은 음성을 통해 웹 자원 탐색을 제공하기 위한 목적으로 설계된 XML 기반의 새로운 마크업 언어이다. VoiceXML로 만들어진 어플리케이션은 기계 주도 폼 다이얼로그 구조와 상호 주도 폼 다이얼로그 구조로 분류된다. 이와 같은 다이얼로그 구조들은 어플리케이션 개발자에 의해 서비스 시나리오가 결정되기 때문에 사용자가 자유롭게 웹 자원을 탐색하는 서비스를 구축할 수 없다. 본 논문에서는 사용자의 의도에 따라 서비스 시나리오가 결정되는 음성 웹 서비스의 구축을 위해 사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션 구조를 제안한다. 제안하는 어플리케이션은 사용자에 의해 요청된 정보로부터 인식 후보들을 자동적으로 검출하여 음성 앵커로 사용하고 각각의 음성 앵커론 새로운 음성 노드로 연결한다. 제안하는 시스템의 예로 IT 용어사전을 내장한 뉴스 서비스를 구현하여 음성 앵커의 검출 및 등록 여부를 확인하였고, 음성 인식률 및 사용자가 의도한 정보를 성공적으로 제공했는지 판단하는 척도가 되는 적중률과 응답 속도를 측정하였다. 실험 결과, 제안한 시스템이 기존의 VoiceXML 폼 다이얼로그 구조의 시스템보다 더 자유로운 웹 자원의 탐색이 가능함을 확인하였다.

Keywords

References

  1. Scott McGlashan, Daniel C. Burnett, Jeny Carter, Peter Danielsen, Jim Ferrans, Andrew Hunt, Bruce Lucas, Brad Porter, Ken Rehor, Steph Tryphonas, 'Voice Extensible Markup Language Version 2.0 Specification', http://www.w3c.org/TR/voicexml20, 2004
  2. Eve Astrid Andersson, Stephen Breitenbach, Tyler Burd, Nirmal Chidambaram, Paul Houle, Daniel Newsome, Xiaofei Tang, Xiaolan Zhu, 'Early Adopter VoiceXML' Wrox, 2002
  3. 박섭형, '음성 웹 어플리케이션 구축을 위한 VoiceXML', 한빛미디어, 2001
  4. Rahul Ram Vankayala, Hao Shi, 'Dynamic Voice User Interface Using VoiceXML and Active Server Pages', LNCS 3841, pp.1181-1184, 2006 https://doi.org/10.1007/11610113
  5. Hemambaradara Reddy, Narayan Annamalai, and Gapal Gupta, 'Listener-Controlled Dynamic Navigation of VoiceXML Documents', LNCS 3118, pp.347-354, 2004
  6. Caccia, G., Lancini, R., Peschiera, G.,'Multimodal browsing using XML/XSL architecture', ITRE2003. IEEE Proceedings of the International Conference on, 2003
  7. Jeffrey E. F. Friedl, 'Mastering Regular Expressions, Third Edition', O'Reilly, 2006
  8. Eric Gamma, Richard Helm, Ralpg Jhanson, John Vissides, 'Design Patterns', Adclison-Wesly Publishing Co., 1995
  9. 국립 국어원, '현대 국어 사용 빈도 조사', 2003
  10. 권형준, 김정현, 이현구, 홍광석, '콘텐츠배급을 위한 RSS 기반의 VoiceXML 다이얼로그 시스템', 정보처리학회 논문지 제14-B권 제1호, pp.51-58, 2007 https://doi.org/10.3745/KIPSTB.2007.14-B.1.051
  11. Min-Jen Tsai, 'The VoiceXML Dialog System for the E-Commerce Ordering Service', IEEE Proceedings of the Ninth International Conference, pp.95-100, 2005