DOI QR코드

DOI QR Code

Development of HTMLtoVTML Conversion Agent using Embedded Text and Priori Structural Knowledge

내장 문자와 사전 구조 지식을 이용한 HTMLtoVXML 변환 에이전트 개발

  • 장영건 (청주대학교 컴퓨터정보공학과)
  • Published : 2003.04.01

Abstract

This paper presents a new agent which convert HTML contents to VXML contents automatically for voice services via web. In this paper, I propose an interactive hybrid sequential contents selection method to select desired contents fast and robustly from known web pages. It uses real time structural features as well as embedded text and/or priori structural knowledge such as link symbol position. To verify its effectiveness, a full agent system is implemented and tested. The method reflects user intention more accurately than conventional selections using structural features and is more robust to variations of HTML programming techniques. The agent is fast and has less computational burden than methods use XML or XHTML conversion as intermediate stage.

본 연구는 음성 인터넷 서비스를 위하여 기존의 HTML 컨텐츠를 자동으로 VXML 컨텐츠로 변환하여 사용하는 방법에 관한 것이다. 문서 변환은 HTML 문서의 해석과 내용 분리에 앞서 컨텐츠의 선택이 필수적으로 요구되지만, 이미 알고 있고, 관심이 있는 내용의 집단적 선택에 대하여는 아직까지 좋은 해법이 없어 보인다. 본 논문에서는 비구조적 데이터로 구성된 웹 문서로부터 필요한 정보 묶음을 선택하기 위하여 웹 문서에 포함된 문자열, 구조에 대한 사용자의 사전 지식을 상호 반응적으로 사용하는 방법을 제안하며, 이를 구현하여 그 타당성을 입증하였다. 제안하는 방식은 기존의 구조적 방식에 의한 선택보다 사용자의 의도를 정확히 반영하며, 문서 표현의 구현 기법의 변화에 강건한 장점이 있다. 또한 컨텐츠 분리 측면에서는 XML또는 XHTML 문서변환을 중간 과정으로 사용하는 방식에 비하여 시간적으로 빠르며, 변환 과정의 부담이 작다.

Keywords

References

  1. Asakawa, 'Annotation-Based Transcoding for Nonvisual Web Access,' Pro. of ASSETS'00, pp.172-179, Nov., 2000 https://doi.org/10.1145/354324.354588
  2. Stuart Goose, Mike Newman, Claus Schmidt, Laurent Hue, 'Enhancing Web accessibility via the Vox Portal and a Web-hosted dynamic HTML<->VoxML converter,' WWW9, Vol.33, No.1-6, pp.583-592, June, 2000 https://doi.org/10.1016/S1389-1286(00)00036-0
  3. Mohan, R., Smith, J. & LI, C.-S., 'Adapting multimedia internet content for universal access,' IEEE Transactions on Multimedia, Vol.1, No.1, pp.104-114, March, 1999 https://doi.org/10.1109/6046.748175
  4. Asakawa, et al, 'User Interface of a Homepage Reader,' Pro. of ASSET'98, pp.149-156, April, 1998 https://doi.org/10.1145/274497.274526
  5. D. W. Embely, Y. S. Jiang and Y. K. Ng, 'Record-boundary discovery in Web documents,' Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data (SIGMOD'99), pp.467-478, May, 1999 https://doi.org/10.1145/304182.304223
  6. David Buttler, Ling Liu, Calton Pu, 'A Fully Automated Extraction System for the World Wide Web,' IEEE ICDCS-21, April, 2001 https://doi.org/10.1109/ICDSC.2001.918966
  7. 최훈일, 장영건, 'HTMLtoVoiceXML 변환기 설계 및 구현', 한국정보과학회논문지 : 컴퓨팅의 실제, 제7권 제6호, pp. 559-568, 2001
  8. Anita W. Huang, 'A Semantic Transcoding System to Adapt Web Services for User with Disabilities,' Pro. of ASSETS'00, pp.156-163, Nov., 2000 https://doi.org/10.1145/354324.354363
  9. Carole Goble, Sean Bechhofer et al, 'Conceptual Open Hypermedia = The Semantic Web?,' Proceedings of the 2nd Int. Workshop on the Semantic Web, May, 20001
  10. Hori M., Kondon G., Ono K., Hirose S. and Singhal S. 'Annotation-based web content transcoding,' In Proc. of WWW9, pp.197-211, May, 2000
  11. Bruce Krulwich, 'Automating the internet : agents as user surrogates,' IEEE Internet Computing, Vol.1, No.4, pp.34-38, July-August,1997 https://doi.org/10.1109/4236.612213
  12. Henry Lieberman, Bonnie A. Nardi, David Wright, 'Training Agents to Recognize Text by Example,' Proceedings of Agents'99, May, 1999 https://doi.org/10.1145/301136.301176
  13. W3C, 'Voice eXtensible Markup Language(Voice XML) version 1.0,' http://www.w3.org/TR/voicexml, W3C Note 05, May, 2000
  14. 이정은, 장지산, 김민수, 김성찬, 신동규, 신동일 'HTMLto-WML 변환기 시스템의 설계 및 구현', 2001년 한국정보과학회 춘계학술대회논문집, 제28권 제1호(A), pp.184-186, 2001
  15. Juliana Freire, Bharat Kumar, Daniel Lieuwen, 'WebViews : Accessing Personalized Web Content and Services,' WWW10, pp.576-586, May, 2001 https://doi.org/10.1145/371920.372160
  16. G. F. Luger, W. A. Stubblefield, 'Artificial Intelligence : Structures and Strategies for Complex Problem Solving,' Third Edition, Addison Wesley Longman, Inc., 1997