DOI QR코드

DOI QR Code

VoiceXML Dialog System Based on RSS for Contents Syndication

콘텐츠 배급을 위한 RSS 기반의 VoiceXML 다이얼로그 시스템

  • 권형준 (성균관대학교 대학원 정보통신공학부) ;
  • 김정현 (성균관대학교 대학원 정보통신공학부) ;
  • 이현구 (서일대학 정보기술계열 정보통신) ;
  • 홍광석 (성균관대학교 정보통신공학부)
  • Published : 2007.02.28

Abstract

This paper suggests prototype of dialog system combining VXML(VoiceXML) that is the W3C's standard XML format for specifying interactive voice dialogues between human and computer, and RSS(RDF Site Summary or Really Simple Syndication) that is representative technology of semantic web for syndication and subscription of updated web-contents. Merits of the proposed system are as following: 1) It is a new method that recognize spoken contents using ire and wireless telephone networks and then provide contents to user via STT(Speech-to-Text) and TTS(Text-to-Speech) instead of traditional method using web only. 2) It can apply advantage of RSS that subscription of updated contents is converted to VXML without modifying traditional method to provide RSS service, 3) In terms of users, it can reduce restriction on time-spate in search of contents that is provided by RSS because it uses ire and wireless telephone networks, not internet environment. 4) In terms of information provider, it does not need special component for syndication of the newest contents using speech recognition and synthesis technology. We implemented a news service system using VXML and RSS for performance evaluation of the proposed system. In experiment results, we estimated the response time and the speech recognition rate in subscription and search of actuality contents, and confirmed that the proposed system can provide contents those are provided using RSS Feed.

본 논문은 갱신이 잦은 콘텐츠의 배급 및 구독을 위해 등장한 시맨틱 웹의 대표적인 기술인 RSS(RDF Site Summary or Really Simple Syndication)와 인터넷에 존재하는 정보를 음성으로 제공하기 위해 제안된 XML 규격의 W3C 표준 마크업 언어인 VoiceXML을 결합한 시스템의 프로토타입을 제시한다. 제안하는 시스템은 인터넷 기반으로 제공되는 콘텐츠를 유무선 전화망을 통해 음성인식 및 합성기술로 제공하기 위한 것으로서, RSS 서비스를 제공하기 위한 기존의 구성을 수정하지 않고 갱신된 콘텐츠의 구독이 손쉬운 RSS의 장점을 VoiceXML에 적용할 수 있는 특징이 있다. 정보 요청자 측면에서는 RSS로 제공되는 콘텐츠 탐색에 인터넷 환경이 아닌 유무선 전화망을 이용하므로 시공간의 제약을 줄일 수 있으며, 정보 제공자 측면에서는 음성인식 및 합성기술을 이용한 콘텐츠의 배급에 최신 정보의 제공을 위한 별도의 구성요소를 필요로 하지 않는 장점이 있다. 제안하는 시스템의 예로 뉴스 서비스를 구현한 결과, 실제 콘텐츠를 구독하고 탐색할 때에 응답 시간과 음성 인식 측면에서 장애 없이 RSS Feed를 이용해 비주얼 환경으로 제공되는 내용과 동일한 내용을 음성으로 제공받을 수 있었다.

Keywords

References

  1. 김인철, 김현식, '시맨틱 웹 서비스 기술 동향', 한국인터넷정보학회지, 제6권 제2호, pp. 7-15, 2005
  2. 조부현, 민영근, 이복주, '시맨틱 웹을 이용한 웹 변경 탐지 시스템' 정보처리학회논문지B, 제13-B권 제1호, pp.21-26, 2006 https://doi.org/10.3745/KIPSTB.2006.13B.1.021
  3. 김중태, '시대의 기회 시맨틱 웹', 디지털미디어리서치, 2006
  4. Eve Astrid Andersson, Stephen Breitenbach, Tyler Burd, Nirmal Chidambaram, Paul Houle, Daniel Newsome, Xiaofei Tang, Xiaolan Zhu, 'Early Adopter VoiceXML', Wrox, 2002
  5. Min-Jen Tsai, 'The VoiceXML Dialog System for the E-Commerce Ordering Service', IEEE Proceedings of the Ninth International Conference, pp.95-100, 2005
  6. Jeong-Hoon Shin, Kwang-Seok Hong, 'Simple and Powerful Interface E-Leaning System Using VXML : Design and Implementation of Web and PSTN Linked Efficient Learning System', LNCS 3980, pp.354-363, 2006 https://doi.org/10.1007/11751540
  7. De Sutter R, Lerouge, S, De Schrijver D, Van de Walle R, 'Enhancing RSS Feeds : Eliminating Overheard through Binary Encoding', IEEE Proceedings of the Third International Conference, pp.520-525, 2005
  8. RSS Specifications, http://www.rss-specifications.com
  9. Harvard University, http://blogs.law.harvard.edu/tech/rss
  10. Atomenabled, http://www.atomenabled.org
  11. Scott McGlashan, Daniel C. Burnett, Jerry Carter, Peter Danielsen, Jim Ferrans, Andrew Hunt, Bruce Lucas, Brad Porter, Ken Rehor, Steph Tryphonas, 'Voice Extensible Markup Language Version 2.0 Specification', http://www. w3c.org/TR/voicexml20, 2004
  12. Rahul Ram Vankayala, Hao Shi, 'Dynamic Voice User Interface Using VoiceXML and Active Server Pages', LNCS 3841, pp.1181-1184, 2006 https://doi.org/10.1007/11610113
  13. KT 음성 인식 서비스 개발팀, 'VXML 기반 HUVOIS Solution Manual R1.1', KT 서비스 개발 연구소, 2003
  14. VOX POPLUI, http://www.voiceingov.org/blog?page_id=8

Cited by

  1. A Study on VoiceXML Application of User-Controlled Form Dialog System vol.14B, pp.3, 2007, https://doi.org/10.3745/KIPSTB.2007.14-B.3.183