색인어 선정을 위한 어휘결집력에 관한 연구

Study on the Vocabulary Synthesis for Index Term Selection

  • 김철 (광주교육대학교 전산교육과) ;
  • 정준민 (전남대학교 문헌정보학과)
  • 발행 : 1996.06.01

초록

본 연구는 정보결집력을 응용한 자동 색인어 선정 기법에 관한 연구로 한 문장내에 나타난 임의의 어휘가 그 문장을 표현하기 위한 의미있는 집합이라는 가설 하에 어휘쌍 그래프를 통하여 색인어를 추출하였다. 특히, 그래프에 나타난 어휘 관계에서 각 어휘의 전체 어휘쌍 그래프에 대한 결집력을 분석하여 그 결집력을 색인어 선정의 우선 순위로 제안하였다. 가설을 검증하기 위하여 먼저 논문의 제목 및 초록에서 두 문장 이상에 동시 출현한 어휘쌍을 추출하였다. 다음으로 추출한 어휘쌍과 저자가 제시한 색인어 또는 주제명과 비교하였으며 그 결과 어휘쌍 그래프에 나타난 어휘가 대부분 색인어 또는 주제명에 사용되고 있음을 분석하였다. 그 중에서도 특히, 어휘쌍 그래프에서 어휘결집력이 높은 어휘일수록 그 논문의 내용을 전달하는 의미있는 색인어로 채택될 가능성이 높음을 보여 주었다.

Under the hypothesis that any pair of terms in the sentence is meaningful to present the context of the paper, the Brillouin measure of term relatedness in automatic indexing is proposed. For the experiment, the pair of terms simul-taneously appeared in two or more sentences of the paper are extracted from the title and abstract of the paper. Com-pared with the list of index terms or subject headings suggested by the author, the terms in term relatedness graph are highly matched with the terms in the list. Especially, it is revealed that the rank of terms by synthetic strength is use-ful in the selection of index terms.

키워드

참고문헌

  1. 계량정보학 김현희;김용호
  2. 정보관리학회지 v.19 no.1 An Investigation of Automatic Term Weighting Techniques 김현희
  3. IBM JRD v.2 Machine-Made Index for Technical Literature-An Experiment Baxendale,P.B.
  4. JASIS v.32 The Brillouin Measure of an Author's Contribution to a Literature in Psychology Bert,Boyce;Martin,David
  5. JASIS v.26 A Decision Theoretic Foundation for Indexing Bookstein,A;Swanson,D.R.
  6. JASIS v.32 The Brillouin Measure of An Author's Contribution to A Literature in Psychology Boyce,B.R.;Martin,D.
  7. Science and Information Theory Brillouin,L.
  8. American Documentation v.6 An Experiment in Automatic Indexing Damerau,F.J.
  9. American Documentation v.13 Indexing and abstracting by association Doyle,L.B.
  10. JASIS v.26 A Probabilistic Approach to Automatic Keyword Indexing :Part I. On the Distribution of Specialty Word in a Technical Literature Harter,S.P.
  11. JASIS v.26 A Probabilistic Approach to Automatic Keyword Indexing : Part Ⅱ. An Algorithm for Probabilistic Indexing Harter,S.P.
  12. Information Processing and Management v.29 Measurement of information Hayes,R.M.
  13. Statistical association methods for mechanized documentation, Proceedings of the Symposium, Washington, 1964 The measurement of information from a file Hayes,R.M.;M.E.Stevens(et al.)
  14. IBM JRD v.2 The Automatic Creation of Literature Abstract Luhn,H.P.
  15. IBM JRD v.4 A Statistical Approach to Mechanized Encoding and Searching of Library Information Luhn,H.P.
  16. Journal of ACM v.7 On Relevance, Probabilistics Indexing and Information Retrieval Maron,M.E.;Kuhns,J.L.
  17. JASIS v.34 A Technique of Two-stage clustering Applied to environment and Civil Engineering and Related Methods of Citation Analysis Miyamoto,S.;Nekayama,K.
  18. JASIS v.33 Collaboration in Computational Musicology Pao,M.L.
  19. Information Processing and Management v.15 Fuzzy set theoretical approach to document retrieval Radecki,T.
  20. Fuzzy Sets and System v.38 Knowledge engineering for a document retrieval systems Ramon Lopex de Mantaras;Ulises Cortes;Jaume Manerp;Enric Plaza
  21. Automatic Information Organization and Retrieval Salton,G.
  22. ACM SIGIR v.16 A blueprint for automatic indexing Salton,G.
  23. Introduction to Modern Information Retrieval Salton,G.;McGill,M.J.
  24. Journal of Documentation v.28 A Statistical Interpretation of Term Specificity and Its Application in Retrieval Sparck Jones,K.
  25. Automatic Keyword Classification for Information Retrieval Sparck Jones,K.