DOI QR코드

DOI QR Code

Patent data analysis using clique analysis in a keyword network

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석

  • Kim, Hyon Hee (Department of Statistics and information Science, Dongduk Women's University) ;
  • Kim, Donggeon (Department of Statistics and information Science, Dongduk Women's University) ;
  • Jo, Jinnam (Department of Statistics and information Science, Dongduk Women's University)
  • 김현 (동덕여자대학교 정보통계학과) ;
  • 김동건 (동덕여자대학교 정보통계학과) ;
  • 조진남 (동덕여자대학교 정보통계학과)
  • Received : 2016.07.11
  • Accepted : 2016.08.30
  • Published : 2016.09.30

Abstract

In this paper, we analyzed the patents on machine learning using keyword network analysis and clique analysis. To construct a keyword network, important keywords were extracted based on the TF-IDF weight and their association, and network structure analysis and clique analysis was performed. Density and clustering coefficient of the patent keyword network are low, which shows that patent keywords on machine learning are weakly connected with each other. It is because the important patents on machine learning are mainly registered in the application system of machine learning rather thant machine learning techniques. Also, our results of clique analysis showed that the keywords found by cliques in 2005 patents are the subjects such as newsmaker verification, product forecasting, virus detection, biomarkers, and workflow management, while those in 2015 patents contain the subjects such as digital imaging, payment card, calling system, mammogram system, price prediction, etc. The clique analysis can be used not only for identifying specialized subjects, but also for search keywords in patent search systems.

본 연구에서는 기계 학습 분야의 특허를 수집하여 키워드 네트워크를 구축하고 클릭 분석을 실시하였다. 먼저 텍스트 마이닝 기법을 적용하여 핵심 키워드들을 선정한 다음, 이 키워드를 기반으로 키워드 네트워크를 구축하였다. 다음으로 네트워크 구조 분석, 중요 키워드 분석 및 클릭 분석을 시행하여 2005년도와 2015년도에 출원된 기계 학습 특허의 동향을 파악하였을 뿐만 아니라 양해년도의 분석 결과를 통해 특허 경향을 파악하였다. 분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에서 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 클릭 분석 결과 2005년도 클릭 분석에 의해 발견된 주제는 뉴스메이커 검증, 상품 소비 예측, 바이러스 공격 예방, 바이오마커, 그리고 워크플로우 관리였으며, 2015년도 기계 학습 특허 주제는 디지털 이미지 편집, 직불카드, 수신자 인라이닝 시스템, 유방 촬영 시스템, 재고 관리 시스템, 이미지 편집 시스템, 비행기 티켓 가격 예측, 그리고 문제 예측 시스템으로 나타났다. 2005년도에 비하여 2015년도의 근접 중앙성은 낮아지고 매개 중심성은 높아진 것으로 보아 최근의 특허 경향은 보다 다양한 분야에서 출원되고 있으며 이들 간의 연결이 활발해지고 있음을 알 수 있다. 클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것으로 기대된다.

Keywords

References

  1. Chae, M., Kang, M. and Kim. Y. (2013). Documents recommendation using large citation data. Journal of the Korean Data & Information Science Society, 24, 999-1011. https://doi.org/10.7465/jkdi.2013.24.5.999
  2. Choi, J. and Hwang, Y. S. (2014). Patent keyword network analysis for improving technology development efficiency. Technological Forecasting & Social Change, 83, 170-182. https://doi.org/10.1016/j.techfore.2013.07.004
  3. Choubey, A., Patel, R. and Rana, J. L. (2012). Graph based new approach for frequent pattern mining, 4, 221-235.
  4. Erdi, P., Makovi, K., Somogyvari, Z., Strandburg, K., Tobochnik, J., Volf, P. and Zalanyi, L. (2013). Prediction of emerging technologies based on analysis of the US patent citation network. Scientometrics, 95, 225-242. https://doi.org/10.1007/s11192-012-0796-4
  5. Faust, K. (2006). Comparing social networks: Size, density, and local structure. Advances in Methodology and Statistics, 3, 185-216.
  6. Freeman, L. C. (1978). Centrality in social networks: Conceptual clarification. Social Networks, 1, 215-239. https://doi.org/10.1016/0378-8733(78)90021-7
  7. Huh, M. H. (2014). Introduction to social network analysis using R, Free Academy, Seoul.
  8. Kang, B., Huh, M. and Choi S. (2015). Performance analysis of volleyball games using the social network and text mining techniques. Journal of the Korean Data & Information Science Society, 26, 619-630. https://doi.org/10.7465/jkdi.2015.26.3.619
  9. Kargar, M. and An, A. (2011). Keyword search in graphs: Finding r-cliques, Proceedings of the VLDB Endowment, 4, 681-692. https://doi.org/10.14778/2021017.2021025
  10. Kwahk, K. Y. (2014). Social network analysis, Cheongram Publisher, Seoul.
  11. Kim, D. H., Kim, H. H., Kim, D. and Jo, J. (2016). Social network analysis of keyword community network in IoT patent data. Journal of Applied Statistics, 29, 719-728.
  12. Lee, S., Cho, J., Kang, C. and Choi, S. (2015). Study on prediction for a film success using text mining. Journal of the Korean Data & Information Science Society, 26, 1259-1269. https://doi.org/10.7465/jkdi.2015.26.6.1259
  13. Lee, S., Yoon, B. and Park Y. (2009). An approach to discovering new technology opprtunities: Keywordbased patent map approaches. Technovation, 29, 481-497. https://doi.org/10.1016/j.technovation.2008.10.006
  14. Li, Y. R., Wang, L. H. and Hong, C. F. (2009). Extracting the significant-rare keywords for patent analysis. Expert Systems with Applications, 36, 5200-5204. https://doi.org/10.1016/j.eswa.2008.06.131
  15. Manning, Chr. D., Raghavan, P. and Schutze, H. (2008). Introduction to Information Retrieval, Cambridge University Press, New York.
  16. Noh, H., Jo, Y. and Lee S. (2015). Keyword selection and processing strategy for applying text mining to patent analysis, Expert Systems with Applications, 42, 4348-4360. https://doi.org/10.1016/j.eswa.2015.01.050
  17. Tseng, Y. H., Lin, C. J. and Lin, Y. I. (2007). Text mining techniques for patent analysis. Information Processing and Management, 43, 1216-1247. https://doi.org/10.1016/j.ipm.2006.11.011
  18. Wasserman, S. and Faust, K. (1994). Social network analysis: Methods and applications, Cambridge University Press, New York.

Cited by

  1. 텍스트마이닝을 이용한 약물유해반응 보고자료 분석 vol.27, pp.4, 2016, https://doi.org/10.24304/kjcp.2017.27.4.221
  2. 키워드 네트워크 분석을 활용한 과학기술동향 분석 vol.23, pp.2, 2016, https://doi.org/10.9723/jksiis.2018.23.2.063
  3. Trend Analysis of Thyroid Cancer Research in Korea with Text Mining Techniques vol.23, pp.12, 2018, https://doi.org/10.9708/jksci.2018.23.12.153
  4. An Ontology-Based Labeling of Influential Topics Using Topic Network Analysis vol.15, pp.5, 2016, https://doi.org/10.3745/jips.04.0137