특허 정보 검색을 위한 대체어 후보 추출 방법

Extracting Alternative Word Candidates for Patent Information Search

  • 발행 : 2009.04.15

초록

특허 정보 검색은 연구 및 기술 개발에 앞서 선행연구의 존재 여부를 확인하기 위한 사전 조사 목적으로 주로 사용된다. 이러한 특히 정보 검색에서 원하는 정보를 얻지 못하는 원인은 다양하다. 그 중에서 본 연구는 키워드 불일치에 의한 정보 누락을 최소화하기 위한 대체어 후보 추출 방법을 제안한다. 본 연구에서 제안하는 대체어 후보 추출 방법은 문장 내에서 함께 쓰이는 단어들이 비슷한 두 단어는 서로 비슷한 의미를 지닐 것이다라는 직관적 가설을 전제로 한다. 이와 같은 가설을 만족하는 대체어를 추출하기 위해서 본 연구에서는 분류별 집중도, 신뢰도를 이용한 연관단어뭉치, 연관단어 뭉치간 코사인 유사도 및 순위 보정 기법을 제안한다. 본 연구에서 제안한 대체어 후보 추출 방법의 성능은 대체어 유형별로 작성된 평가지표를 이용하여 재현율을 측정함으로써 평가하였으며, 제안 방법이 문서 벡터공간 모델의 성능보다 더 우수한 것으로 나타났다.

Patent information search is used for checking existence of earlier works. In patent information search, there are many reasons that fails to get appropriate information. This research proposes a method extracting alternative word candidates in order to minimize search failure due to keyword mismatch. Assuming that two words have similar meaning if they have similar co-occurrence words, the proposed method uses the concept of concentration, association word set, cosine similarity between association word sets and a ranking modification technique. Performance of the proposed method is evaluated using a manually extracted alternative word candidate list. Evaluation results show that the proposed method outperforms the document vector space model in recall.

키워드

참고문헌

  1. 장백국제특허법률사무소, "선행기술 검색안내," http://www.k8.co.kr/htm/8-2_1.htm/
  2. 박용준, "특허정보 검색방법", (주)아이피플, 2005
  3. Pierre P. Senellart and Vincent D. Blondel, “Auto-matic discovery of similar words,” in Survey of Text Mining, Springer, 2003
  4. Hsinchun Chen and Kevin J. Lynch, “Automatic construction of networks of concepts characterizing document databases,” IEEE Transactions on Sys-tems, Man and Cybernetics, Vol.22(5), 885-902, 1992 https://doi.org/10.1109/21.179830
  5. Magnus Sahlgren, "The Word-Space Model," Ph.D. Dissertation, Stockholm University, Stockholm, Sweden 2006
  6. Jon M. Kleinberg, 'Automatic construction of net-works of concepts characterizing document data-bases,' Journal of the ACM, Vol.46(5), 604-632, 1999 https://doi.org/10.1145/324133.324140
  7. Vincent D. Blondel and Pierre P. Senellart, 'Auto-matic extraction of synonyms in a dictionary,' Presented at the TextMining Workshop, Arlington, Virginia, 2002
  8. 이성진, "키워드 샾에서의 상품 추천을 위한 연관 키워드 그룹 추출 기법", M.S. Thesis, Soongsil Uni-versity, Seoul, Korea 2003
  9. Jiawel Han and Micheline Kamber, Data Mining Concepts and Techniques, 2nd ed., Morgan Kauf-mann, 2006