DOI QR코드

DOI QR Code

Implementation of Ontology-based Service by Exploiting Massive Crime Investigation Records: Focusing on Intrusion Theft

대규모 범죄 수사기록을 활용한 온톨로지 기반 서비스 구현 - 침입 절도 범죄 분야를 중심으로 -

  • Received : 2019.01.16
  • Accepted : 2019.02.20
  • Published : 2019.02.28

Abstract

An ontology is a complex structure dictionary that defines the relationship between terms and terms related to specific knowledge in a particular field. There have been attempts to construct various ontologies in Korea and abroad, but there has not been a case in which a large scale crime investigation record is constructed as an ontology and a service is implemented through the ontology. Therefore, this paper describes the process of constructing an ontology based on information extracted from instrusion theft field of unstructured data, a crime investigation document, and implementing an ontology-based search service and a crime spot recommendation service. In order to understand the performance of the search service, we have tested Top-K accuracy measurement, which is one of the accuracy measurement methods for event search, and obtained a maximum accuracy of 93.52% for the experimental data set. In addition, we have obtained a suitable clue field combination for the entire experimental data set, and we can calibrate the field location information in the database with the performance of F1-measure 76.19% Respectively.

온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.

Keywords

MHJBB6_2019_v53n1_57_f0001.png 이미지

<그림 1> OntoFrame의 연구 Trend 등을 시각화하여 나타내는 결과 화면

MHJBB6_2019_v53n1_57_f0002.png 이미지

<그림 2> 온톨로지 구축 및 기반 서비스 도식도

MHJBB6_2019_v53n1_57_f0003.png 이미지

<그림 3> 트리플 추출 과정

MHJBB6_2019_v53n1_57_f0004.png 이미지

<그림 4> 온톨로지 구축 및 기반 서비스

MHJBB6_2019_v53n1_57_f0005.png 이미지

<그림 5> 침입 절도 데이터베이스를 기반으로 구축한 온톨로지의 시각화 출력 예시

MHJBB6_2019_v53n1_57_f0006.png 이미지

<그림 6> 온톨로지 구성 과정과 사용되는 데이터베이스의 종류

MHJBB6_2019_v53n1_57_f0007.png 이미지

<그림 7> 침입 절도 온톨로지 기반 검색 서비스 메인 UI

MHJBB6_2019_v53n1_57_f0008.png 이미지

<그림 8> 이어서 검색하는 과정과 사건 검색 수행에 대한 예시 1

MHJBB6_2019_v53n1_57_f0009.png 이미지

<그림 9> 이어서 검색하는 과정과 사건 검색 수행에 대한 예시 2

MHJBB6_2019_v53n1_57_f0010.png 이미지

<그림 10> 검색 방식별 네트워크 출력 예시 1

MHJBB6_2019_v53n1_57_f0011.png 이미지

<그림 11> 검색 방식별 네트워크 출력 예시 2

MHJBB6_2019_v53n1_57_f0012.png 이미지

<그림 12> 침입 절도 온톨로지 기반 적합 범행 장소 추천 서비스의 네트워크 예시

<표 1> 침입 절도 사건 데이터 기반 트리플 추출 작업 결과에 대한 통계 정보

MHJBB6_2019_v53n1_57_t0001.png 이미지

<표 2> 필드 검색 서비스에서 활용하는 자질 정보

MHJBB6_2019_v53n1_57_t0002.png 이미지

<표 3> 범행 장소 추천 서비스에서 활용하는 자질 정보

MHJBB6_2019_v53n1_57_t0003.png 이미지

<표 4> 최적화 실험을 위한 변수 범위

MHJBB6_2019_v53n1_57_t0004.png 이미지

<표 5> 필드 검색 서비스에 사용되는 최적화된 가중치 변수

MHJBB6_2019_v53n1_57_t0005.png 이미지

<표 6> 검색 시스템의 필드 완전 일치 Top-5 실험 결과

MHJBB6_2019_v53n1_57_t0006.png 이미지

<표 7> 검색 시스템의 유사 필드 2종 활용 Top-5 실험 결과

MHJBB6_2019_v53n1_57_t0007.png 이미지

<표 8> 침입 절도 온톨로지 기반 적합 범행 장소 추천 서비스의 실험 결과

MHJBB6_2019_v53n1_57_t0008.png 이미지

References

  1. [Exclusive] 5.2 Billion AI Investigator 'Clue' Blocks 'Memories of Murder' Recurrence. 2017. Korea Joongang Daily. December 8.
  2. Ko, Gun-Woo et al. 2018. "Implementation of Ontology-based Analytics Service by Exploiting Massive Crime Investigation Records." The 30th Annual Conference on Human & Cognitive Language Technology, October 13, 2018, Seoul: Korea University Business School.
  3. National Library of Korea. 2013. National Library of Korea National Survey Linked Open Data Service. [online] [cited 2018. 9. 28.]
  4. Kwon, Yang-Sub. 2017. "Study on the Application and Legal Limits of Big Data for Crime Prevention and Investigation." Law Review, 17(1): 179-198.
  5. Kim, Yong-Hoon and Chung, Mok-Dong. 2017. "Analysis of Structured and Unstructured Data and Construction of Criminal Profiling System using LSA." Journal of Korea Multimedia Society, 20(1): 66-73. https://doi.org/10.9717/kmms.2017.20.1.066
  6. Kim, Pyung et al. 2008. "The Academic Information Analysis Service using OntoFrame-Recommendation of Reviewers and Analysis of Researchers' Accomplishments." Journal of KIISE: Software and Applications, 35(7): 431-441.
  7. Park, Kyung-Mo, Lim, Hee-Sook and Park, Jong-Hyun. 2003. "Building an Ontology for Structured Data Entry of Signs and Symptoms in Oriental Medicine." Journal of Physiology & Pathology in Korean Medicine, 17(5): 1151-1156.
  8. Park, Joon-Young, Chae, Myung-Su and Jung, Sung-Kwan. 2016. "Classification Model of Types of Crime based on Random-Forest Algorithms and Monitoring Interface Design Factors for Real-time Crime Prediction." KIISE Transactions on Computing Practices, 22(9): 455-460. https://doi.org/10.5626/KTCP.2016.22.9.455
  9. Bang, Seung-Hwan, Kim, Tae-Hun and Cho, Hyun-Bo. 2014. "A Study on the Applicability of Data Mining for Crime Prediction: Focusing on Burglary." Journal of the Korea Society of Computer and Information, 19(12): 309-317. https://doi.org/10.9708/jksci.2014.19.12.309
  10. Song, Yeong-Kil, Jeong, Seok-Won and Kim, Hark-Soo. 2015 "A Semi-automatic Construction method ofa Named Entity Dictionary Based on Wikipedia." Journal of KIISE, 42(11): 1397-1403. https://doi.org/10.5626/JOK.2015.42.11.1397
  11. Wikipedia. 2018. "Ontology." [online] [cited 2018. 6. 30.]
  12. Chung, Young-Suk, Kim, Jin-Mook and Park, Koo-Rack. 2012. "A study of improved ways of the predicted probability to criminal types." Journal of the Korea Society of Computer and Information, 17(4): 163-172. https://doi.org/10.9708/jksci.2012.17.4.163
  13. Jo, Dae-Woong, Choi, Ji-Woong and Kim, Myung-Ho. 2014. "The Design and Implementation of OWL Ontology Construction System through Information Extraction of Unstructured Document." Journal of The Korea Society of Computer and Information, 19(10): 23-33. https://doi.org/10.9708/jksci.2014.19.10.023
  14. Korea Information Science Agency. 2014. 2014 Linked Open Data Domestic Casebook, Seoul.
  15. Hwang, Mi-Nyeong et al. 2012. "Ontology Construction of Technological Knowledge for R&D Trend Analysis." The Journal of the Korea Contents Association, 12(12): 35-45. https://doi.org/10.5392/JKCA.2012.12.12.035
  16. Abasolo, J. M. and Gomez, M. 2000. "MELISA: An ontology-based agent for information retrieval in medicine." In Proceedings of the first international workshop on the semantic web (SemWeb2000), 73-82.
  17. Asaro, C. et al. 2003. "A domain ontology: Italian crime ontology." In Proceedings of the ICAIL 2003 Workshop on Legal Ontologies & Web based legal information management.
  18. Franz INC. Gruff. [online] [cited 2018. 9. 28.]
  19. Noy, N. F. and McGuinness, D. L. 2001. "Ontology development 101: A guide to creating your first ontology." Stanford Knowledge Systems Laboratoryand Technical Report KSL-01-05 and Stanford Medical Informaticsand Technical Report SMI-2001-0880.
  20. Oh, S. 2017. "Top-k Hierarchical Classification." In AAAI, 2450-2456.
  21. Raimond, Y. et al. F. 2007. "The Music Ontology." In Proceedings of the 8th International Conference on Music Information Retrieval, ISMIR 2007, September 23-27, 2007, Vienna, Austria.