DOI QR코드

DOI QR Code

연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구

A Clustering Technique Using Association Rules for The Library and Information Science Terminology

  • 승현우 (서울여자대학교 정보통신공학부 컴퓨터공학전공) ;
  • 박미영 (서울여자대학교 정보영상학부 문헌정보학전공)
  • 발행 : 2003.06.01

초록

본 논문에서는 대량의 웹 문서로부터 연관된 지식정보를 검색하기 위한 전문 검색엔진을 개발하기 위하여 텍스트에서 추출된 전문 용어를 효율적으로 클러스터링하기 위한 방법을 제안하고자 한다. 즉, 일반적인 용어들간의 무의미한 연관 규칙이 양산되는 것을 방지하기 위하여 전문 용어로 구성된 지식베이스 테이블을 이용하여 의미 있는 용어들간의 연관 규칙을 생성한다. 연관 규칙은 하나의 논문에서 사용된 전문 용어들의 집합을 트랜잭션 단위로 구성하여 Apriori 알고리즘을 적용하여 생성된다. 하나의 용어로부터 생성된 연관 규칙 집합은 해당 전문 용어와 관련된 클러스터로 구성된다.

In this paper, an effective method for clustering terminologies extracted from text is proposed, in order to develope a search engine to extract relevant information from large web documents. To prevent frequency of the meaningless association rules among general terminologies, only useful association rules among terminologies are produced using database tables which consist of domain-specific terminologies. Such association rules are produced by applying the Apriori algorithm after forming transaction units from groups of association rules in a document. A group of association rules produced from a terminology forms in a cluster.

키워드

참고문헌

  1. 한국어 형태소 분석 라이브러리 강승식;HAM
  2. 한국정보과학회논문지 v.19 no.1 용어 빈도수를 이용한 영문 문헌정보의 점진적인 개념적 집단화 김호성;고희정
  3. 석사학위논문 Apriori 알고리즘 연관규칙 마이닝기법을 이용한 정보검색 박건호
  4. 한국정보과학회 v.27 no.1 전문 용어 추출 시스템 박정오;황도삼
  5. 한국정보과학회 SIGDB 춘계튜토리얼 연관 규칙 탐사와 그 응용 박종수;유원경;홍기형
  6. 한국정보과학회 v.27 no.1 주요 항목 집합을 이용한 문서 클러스터링 및 연관 규칙 탐사 기법 서성보;김선철;이준욱;류근호
  7. 제3회 한국정보처리학회 정보기술워크숍 상용 DataMining Tool비교 분석 승현우;박미영;조영한;강미나
  8. 제4회 한국정보처리학회 정보기술워크숍 데이터마이닝 기법과 연구동향분석 승현우;박미영;황정민
  9. 서울여자대학교 자연과학연구소논문집 데이터마이닝 기법을 이용한 문헌정보학 전문용어 클러스터링 데이터베이스 설계에 관한 연구 승현우;박미영;황정민
  10. 박사학위논문 웹 문서 분류를 위한 단어의 연관성 모델과 클러스터링 모델 신진섭
  11. 데이터마이닝에 관한 연구 이란주
  12. 한국정보과학회 v.27 no.1 웹 디렉토리 서비스를 위한 문서 클러스터링 이문기;권오욱;이종혁
  13. 이화여자대학교 과학기술대학원 컴퓨터학과 EIST Research Report Series 데이터마이닝 알고리즘 분석 이정원(외12인)
  14. 석사학위논문 데이터마이닝 기법을 이용한 전문용어 클러스터링 이정화
  15. Hypergraph Based Clustering In A High Dimensional Data Sets : A Summary of Results Eui-Hong Han;Vipin Kumar;George Karypis
  16. Data Mining: Concepts and Techniques Han, Jiawei
  17. Proc. of VLDB Fast Algorithms for Mining Association Rules R.Agrawal;Chu Xu
  18. CMU-CS-96-18 A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization Thorsten Joachims
  19. Information Retrieval : Data Structures & Algorithms William B. Frakes;Ricardo Baeza-Yates

피인용 문헌

  1. An Experimental Study on the Technical Term Based Analysis of University Library Collection: With a Focus on Computer Field vol.45, pp.2, 2011, https://doi.org/10.4275/KSLIS.2011.45.2.393
  2. Analyzing Customer Feedback Differences between VOCs and External Channels vol.41, pp.3, 2018, https://doi.org/10.11627/jkise.2018.41.3.129