FolksoViz: A Subsumption-based Folksonomy Visualization Using the Wikipedia

FolksoViz: Wikipedia 본문을 이용한 상하위 관계 기반 폭소노미 시각화 기법

  • 이강표 (서울대학교 컴퓨터공학부) ;
  • 김현우 (서울대학교 컴퓨터공학부) ;
  • 장충수 (서울대학교 컴퓨터공학부) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • Published : 2008.06.15

Abstract

Folksonomy, which is created through the collaborative tagging from many users, is one of the driving factors of Web 2.0. Tags are said to be the web metadata describing a web document. If we are able to find the semantic subsumption relationships between tags created through the collaborative tagging, it can help users understand the metadata more intuitively. In this paper, targeting del.icio.us tag data, we propose a method named FolksoViz for deriving subsumption relationships between tags by using Wikipedia texts. For this purpose, we propose a statistical model for deriving subsumption relationships based on the frequency of each tag on the Wikipedia texts, and TSD(Tag Sense Disambiguation) method for mapping each tag to a corresponding Wikipedia text. The derived subsumption pairs are visualized effectively on the screen. The experiment shows that our proposed algorithm managed to find the correct subsumption pairs with high accuracy.

다수의 사용자들의 협력태깅으로 생성되는 폭소노미는 웹 2.0을 이끌고 있는 대표적인 요소이다. 태그는 어떤 웹 문서를 기술하는 웹 메타데이타라고 할 수 있는데, 협력태깅으로 이루어진 태그들 사이의 의미적인 상하위 관계를 밝혀내 이를 시각화한다면, 사용자들이 문서의 메타데이타를 보다 직관적으로 이해하는 데 도움을 줄 수 있다. 이에 본 논문에서는 del.icio.us의 태그들을 대상으로 하여, Wikipedia 텍스트를 이용한 태그들간 상하위 관계 산출 기법을 제안한다. 이를 위해 태그들이 Wikipeida 텍스트상에서 출현하는 빈도수를 기반으로 태그들간 상하위 관계를 산출하는 통계적인 모델링을 제안하였고, 각각의 태그를 그에 상응하는 Wikipedia 텍스트에 매핑시키는 TSD 기법을 제안하였다. 이렇게 산출된 상하위 관계 짝들은 시각화 기법을 통하여 효과적으로 화면에 표현되었다. 실제로 우리가 제안하는 알고리즘이 태그들간의 상하위 관계들을 높은 정확도로 찾아내었음을 실험을 통해 확인하였다.

Keywords

References

  1. del.icio.us, http://del.icio.us
  2. Flickr, http://www.flickr.com
  3. K. Bielenberg and M. Zacher, "Groups in Social Software: Utilizing Tagging to Integrate Individual Contexts for Social Navigation," Masters Thesis submitted to the Program of Digital Media, Unisersitat Bremen, 2006
  4. Rashmi Sinha, "A cognitive analysis of tagging," http://www.rashmisinha.com/archives/05_09/tagging-cognitive.html, 2005
  5. Scott Golder and Bernardo A. Huberman, "Usage Patterns of Collaborative Tagging Systems," Journal of Information Science, Vol. 32, No. 2, pp. 198-208, 2006 https://doi.org/10.1177/0165551506062337
  6. Miller G. A., "WordNet: A Lexical Database for English," Communications of the ACM, Vol. 38, No. 11, pp. 39-41, 1995
  7. Sharon A. Caraballo and Eugene Charniak, "Determining the Specificity of Nouns from Text," in Proceedings of the joint SIGDAT conference on empirical methods in natural language processing (EMNLP) and very large corpora (VLC), pp. 63- 70, 1999
  8. Forsyth R. and Rada R., "Adding an edge in Machine Learning: applications in expert systems and information retrieval," Ellis Horwood Ltd., pp. 198-212, 1986
  9. Mark Sanderson and Bruce Croft, "Deriving Concept Hierarchies from Text," in Proceedings of the 22nd ACM Conference of the Special Interest Group in Information Retrieval, pp. 206-213, 1999
  10. Paul Clough, Hideo Joho, and Mark Sanderson, "Automatically Organising Images using Concept Hierarchies," in Proceedings of the Workshop on Multimedia Information Retrieval, SIGIR, pp. 2005
  11. Patrick Schmitz, "Inducing ontology from Flickr tags," in Proceedings of the Collaborative Web Tagging Workshop, WWW, pp. 2006
  12. Shui-Lung Chuang and Lee-Feng Chien, "Taxonomy generation for text segments: A practical web-based approach," ACM Transactions on Information Systems (TOIS), Vol. 23, No. 4, pp. 363-396, 2005 https://doi.org/10.1145/1095872.1095873
  13. Wikipedia, http://wikipedia.org/
  14. Nancy Ide and Jean Veronis, "Word Sense Disambiguation: The State of the Art," http://www. up.univ-mrs.fr/-veronis/pdf/1998wsd.pdf, 1998
  15. Marti A. Hearst, "User Interfaces and Visualization," Modern Information Retrieval, New York: ACM Press, pp. 257-323, 1999
  16. JGraph, http://www.jgraph.com