• 제목/요약/키워드: Author Identification

검색결과 126건 처리시간 0.05초

작성자 분석과 CNN을 적용한 소스 코드 작성자 식별 프레임워크 (The Identification Framework for source code author using Authorship Analysis and CNN)

  • 신건윤;김동욱;홍성삼;한명묵
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.33-41
    • /
    • 2018
  • 최근 인터넷 기술이 발전함에 따라 다양한 프로그램들이 만들어지고 있고 이에 따라 다양한 코드들이 많은 사람들을 통해 만들어진다. 이러한 측면을 이용하여 특정 작성자가 작성한 코드들 그대로 가져가 자신이 작성한 것처럼 보여주거나, 참고한 코드들에 대한 정확한 표기 없이 그대로 사용하여 이에 대한 보호가 점차 어려워지고 있다. 따라서 본 논문에서는 작성자 분석 이론과 합성곱 신경망 기반 자연어 처리 방법을 적용한 작성자 식별 프레임워크룰 제안한다. 작성자 분석 이론을 적용하여 소스 코드에서 작성자 식별에 적합한 특징들을 추출하고 이를 텍스트 마이닝에서 사용하고 있는 특징들과 결합하여 기계학습 기반의 작성자 식별을 수행한다. 그리고 합성곱 신경망 기반 자연어 처리 방법을 소스 코드에 적용하여 코드 작성자 분류를 수행한다. 본 논문에서는 작성자 분석이론과 합성곱 신경망을 적용한 작성자 식별 프레임워크를 통해 작성자를 식별하기 위해서는 작성자 식별만을 위한 특징들이 필요하다는 것과 합성곱 신경망 기반 자연어 처리 방법이 소스 코드등과 같은 특수한 체계를 갖추고 있는 언어에서도 적용이 가능하다. 실험 결과 작성자 분석 이론 기반 작성자 식별 정확도는 95.1%였으며 CNN을 적용한 결과 반복횟수가 90번 이상일 경우 98% 이상의 정확도를 보여줬다.

과학기술 전거데이터 시스템에서의 해외 학술논문 저자 식별요소 추출 (Extraction of Author Identification Elements of Overseas Academic Papers on Authority Data System for Science and Technology)

  • 최현미;이석형;김광영;김환민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.711-713
    • /
    • 2013
  • 페이스북, 트위터, 등의 소셜 네트워크의 확산으로 전 세계의 다양한 인적정보를 접할 수 있다. 과학기술 분야에서도 많은 인적정보가 있지만 과학기술자 정보가 체계적으로 정리되지 않아 협력 연구 파트너, 등 업무에 적합한 연구자를 찾기 어려운 문제점이 있다. 이런 문제점을 해결하고자 학술문헌 저자를 중심으로 과학기술 전거데이터를 구축하고 있다. 이 논문에서는 1994년부터 2012년까지 수집한 해외 학술논문 저자명 전거데이터를 구축하기 위하여 수백만건의 학술논문에서 저자 식별 요소를 추출한다. 저자 식별요소는 한글, 영문, 한문(일본어 포함)을 대상으로 저자명, 소속기관명, 학술지명, 발행년도, 키워드, 공저자와 공저자 소속기관, 등이 있다. 이 언어별 식별정보를 기반으로 해외 학술논문 정보에서 저자 식별 정보를 추출하여 데이터베이스를 구축하였다. 향후, 이 추출된 정보를 기반으로 저자 식별 정보를 클러스터링하고 수정, 편집하여 연구자에 대한 학술정보 활동내역을 정리할 예정이다. 구축될 해외 학술논문 전거 데이터는 연구 협력 파트너 찾기, 과제 심사위원 추천, 등 연구자 정보의 활용도를 높여 연구자 커뮤니티를 활성화시키는데 유용하게 사용될 수 있다.

  • PDF

Artificial Neural Network를 이용한 논문 저자 식별 (Author Identification Using Artificial Neural Network)

  • 정지수;윤지원
    • 정보보호학회논문지
    • /
    • 제26권5호
    • /
    • pp.1191-1199
    • /
    • 2016
  • 논문 심사는 공정성을 확보하기 위하여 누가, 누구의 논문을 리뷰하는지 알 수 없도록 블라인드 리뷰를 시행한다. 하지만 일반적으로 논문은 저자의 연구 분야뿐만 아니라 저자가 자주 사용하는 단어, 어휘 등으로 이루어지기 때문에 저자의 정보를 숨기더라도 논문의 내용을 통해 저자를 파악할 수 있다. 본 논문에서는 저자 20명의 논문 315편을 수집하고 텍스트를 추출하여 데이터 정제 작업을 수행하였다. 그리고 정제 작업을 통해 추출된 단어를 추출해내어 인공신경망(artificial neural network)을 통한 분류를 진행함으로써 블라인드 리뷰(blind review)의 우회 가능성을 보였다. 실험을 통해 기존 블라인드 리뷰 시스템의 한계점을 보임으로써 향후 더욱 안전한 블라인드 리뷰 시스템의 필요성을 강조하였다.

Identification of Authors and ethics of Research based on KODISA Case

  • ZHANG, Fan;SU, Shuai;YOUN, Myoung-KIl
    • 연구윤리
    • /
    • 제1권2호
    • /
    • pp.11-13
    • /
    • 2020
  • Purpose: The author wants to specify scope of research, identify without giving burden, prevent unfair identification of the author, admit of production of the outcome, enact rules of identification, and build up foundation of development. Also, this study defines scope of publication of outcome of research to prevent unfair identification of authors and admit of them. Research design, data and methodology: The study described literary research, standard research, phenomenon research, and empirical result without methodologies, statistical analysis and scientific test and investigated operation system of KODISA cases. Results: At publication of findings of the research, researchers shall identify the ones of production of the finding to allocate help of the research. Conclusions: Scientific journals shall be controlled to develop ability and to grow up and have a system. Researchers shall give direction of other scientific journals. The study made efforts to be a model. KODISA Edition Team shall make an effort to keep and develop. So far, no regulation of identification of authors has produced disturbance so terminologies should be uniformed. Researchers shall keep rules of identification of authors to uniform and regulate identification of authors, conditions of authors, and order and correspondent authors. KODISA enacted rules of identification of authors for the first time in Korea to develop science.

LTE 자가 구성 네트워크망에서 물리적 셀 ID할당 방법 연구 (A Study of PCI (Physical Cell Identification) Assignment in LTE (Long Term Evolution) SON (Self-Organization Network))

  • 양모찬
    • 전기전자학회논문지
    • /
    • 제23권3호
    • /
    • pp.941-946
    • /
    • 2019
  • 본 논문에서는 LTE(Long Term Evolution) SON(Self Organization Network) 환경에서 PCI(Physical Cell Identification)를 할당하는 방법에 대하여 분석하였다. PCI를 할당하는 방법에 다양한 기법들이 제시되었고 규격에서는 기본적으로 PCI를 할당하는 과정에서 다른 셀과 ID가 '충돌'(Collision) 또는 '혼란'(Confusion)을 일으킬 수 있다는 것을 제시하였다. 따라서 본 논문에서는 LTE 규격에서 제시하는 PCI '충돌', '약한충돌'(Weak Collision) 그리고 '혼란'의 시나리오가 무엇인지 내용을 살펴보았다. 또한, 각 시나리오에 대한 해결 방법으로 셀 중앙적접근과 분산적 접근 방법에 대해 살펴보았다. 논문에서는 최근 연구되고 있는 그래픽 컬러링(Graphic Coloring) 기법에 대한 접근 방법에 대해 살펴보았고 중앙접근적 방법에 대한 전략에 대해 설명하였다.

국내 과학기술콘텐츠 저자의 소속기관명 식별을 위한 소속기관명 자동 식별 알고리즘에 관한 연구 (A Study on the Identification Algorithm for Organization's Name of Author of Korean Science & Technology Contents)

  • 김진영;이석형;서동준;김광영;윤정선
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.373-382
    • /
    • 2017
  • 과학기술콘텐츠가 증가함에 따라 과학기술콘텐츠의 효율적인 검색을 지원하는 서비스가 요구되고 있다. 저자의 소속기관명을 키워드로 사용할 경우 한 기관에서 생산된 콘텐츠를 확인할 수 있을 뿐만 아니라 저자, 용어를 키워드로 사용한 검색 결과의 식별율을 향상 시킬 수 있다. 검색 키워드로 사용되는 데이터들의 중의성과 모호성으로 인해 검색 결과에 false negative, false positive가 포함될 수 있으므로 데이터의 식별을 통한 통제는 중요하다. 저자의 소속기관명의 식별을 통한 통제 역시 기관의 이명, 약어 검색을 지원가능하게 하므로 매우 중요하지만 기존의 데이터 식별을 통한 통제에 대한 연구는 저자, 용어에 대한 연구가 주를 이루었다. 본 연구에서는 기관명 식별 알고리즘을 제안하고, 한국과학기술정보연구원에서 보유하고 있는 국내 과학기술콘텐츠들에 대한 데이터를 이용한 실험 결과를 보인다.

Identification and Control for Nonlinear Discrete Time Systems Using an Interconnected Neural Network

  • Yamamoto, Yoshihiro
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.994-998
    • /
    • 2005
  • A new control method, called a simple model matching, has been recently developed by the author. This is very simple and be applied for linear and nonlinear discrete time systems with/without time lag. Based on this formulation, identification is examined in this paper using an interconnected neural network with the EBP-EWLS learning algorithm. With this result, a control method is also presented for a nonlinear discrete time system.

  • PDF

대표 속성을 이용한 저자 개체 식별 (Author Entity Identification using Representative Properties in Linked Data)

  • 김태홍;정한민;성원경;김평
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.17-29
    • /
    • 2012
  • 급격하게 성장하고 있는 오픈 리소스인 링크드 데이터는 최근 선진국 정부의 많은 관심 속에 데이터 공개 및 상호운용성 확보를 위한 방안으로 주목받고 있다. 그러나 신뢰할 수 있는 개체 식별 기술의 부재로 링크드 데이터의 양적 성장에 비해 개체 수 대비 링크의 수가 적은 현상과 일부 데이터 셋에 링크가 집중되는 현상을 보이고 있다. 본 연구에서는 이러한 링크드 데이터의 문제를 해결하기 위해 개체 간 관계(owl:sameAs, owl differentFrom 등)를 이용하거나 Curation 방식을 사용하는 기존 링크드 데이터 기반 개체 식별 방식의 문제를 다중 온톨로지의 개체 식별이 가능한 자동화된 개체 식별 방식을 통해 개선하고 저자 개체의 대응 속성과 개체 유형의 논리적 특성을 활용하여 개체 식별 정합성을 검증할 수 있는 다중 온톨로지 기반의 실시간 저자 식별 방법을 제안하고 평가한다. 본인의 확인을 거친 29명의 저자 정보를 이용해 개체 식별 정확성 결과를 평가하여 평균 0.8533 (K measure)의 긍정적인 성능을 보였다.

국내 학술논문 저자명 전거데이터 구축 방안에 관한 연구 (A Study on the Construction for Name Authority Data of the Korean Academic Papers)

  • 이석형;곽승진
    • 한국비블리아학회지
    • /
    • 제21권1호
    • /
    • pp.105-118
    • /
    • 2010
  • 본 연구의 목적은 국내 학술지, 회의자료 등 학술논문에 나타나는 저자명을 중심으로 저자명 전거데이터를 구축하기 위한 방안과 이를 적용한 전거데이터 구축시스템을 제시하는데 있다. 학술논문 저자명 전거데이터를 구축하기 위해 저자명 식별 요소를 분석하고 이를 토대로 저자 식별방법을 제안하였으며, 국내 학술논문의 저자명을 대상으로 실제 저자명 전거레코드를 구성하였다. 또한, 학술논문의 입수주기 및 규모를 고려하여 학술정보 데이터베이스구축과 동시에 전거데이터가 구축, 관리되고 학술정보 서비스와 연계될 수 있도록 학술논문 관리시스템과 서비스시스템과 본 연구의 제안 시스템이 상호 연계성을 가질 수 있도록 설계되었다.

현대 증(證) 정의의 역사 -20세기 중국의 문헌을 중심으로- (History of definitions of the Zheng (證) - a study based on 20th century Chinese literatures -)

  • 김기왕
    • 대한한의진단학회지
    • /
    • 제20권1호
    • /
    • pp.45-50
    • /
    • 2016
  • Objectives Although the word Zheng (證) is widely used basic term in nowaday's East Asian traditional medicine, it's definition can't be found in ancient texts before 20th century, and the history in which that term got general meaning in public, have not been clearly introduced. So the present author show the way Zheng confirm it's modern implication. Methods To search the books that contain any contents on Zheng's definition, the author mainly used the electronic texts of Super Star Reader (超星閱讀器). To search modern study article on Zheng's definition, the author used China National Knowledge Infrastructure (www.cnki.net). Results The present study shows that : although Treatments according to disease Pattern Identification (辨證施治) have been prominent treatment modality in East Asian traditional medicine, the general definition of disease Pattern (證) was given in late 20th century. Especially from 1955 to 1965, some major scholars like Ren Ying Qiu (任應秋), Zhu Yan (朱顔), Qin Bo Wei (秦伯未) and Jiang Jian Fu (蔣見復) did important roles in it's concept creation. Conclusions Modern concept of Zheng (證) was defined in late 20th century.