미디어 영상 자동 분류를 위한 온톨로지 모델링 및 규칙 기반 추론

DOI QR코드

DOI QR Code

박현규;소치승;박영택
Park, Hyun-Kyu;So, Chi-Seung;Park, Young-Tack

  • 투고 : 2015.10.21
  • 심사 : 2016.01.05
  • 발행 : 2016.03.15

초록

최근 스마트 디바이스가 많이 보급되면서 개인 영상 미디어가 다양한 방식으로 생성되어 영상 미디어를 이용한 서비스가 요구되고 있다. 이에 따라 영상 미디어 분석 및 인지 기술에 대한 연구가 활발히 진행되어, 영상으로부터 의미 있는 객체를 인지할 수 있게 되었다. 기존의 미디어 온톨로지를 이용한 시스템은 영상의 제목, 태그 및 스크립터 정보를 이용하기 때문에 영상에 등장하는 객체를 통해 미디어 분류를 수행할 수 없는 단점이 있다. 따라서 본 논문에서는 영상 미디어 데이터에서 인지되는 객체들을 이용해 해당 영상이 속하는 범주로 자동 분류하기 위해 서술논리 기반(Description Logic) 추론 시스템과 순서에 따라 달라질 수 있는 이벤트 처리를 위한 규칙 기반 추론 시스템을 제안한다. 제안하는 서술논리 기반 추론 시스템은 영상 미디어에서 인지되는 객체들의 관계를 서술논리로 정의된 행위(Activity) 온톨로지로 표현하고, 실체화 추론을 통해 인지된 객체가 행위로 추론되는 방법에 대해 설명한다. 규칙 기반 추론 시스템은 추론된 행위의 순서에 따른 이벤트를 정의하고 순서 기반 규칙 추론을 이용하여 범주에 알맞은 이벤트로 자동 분류하는 방법에 대하여 설명한다. 제안하는 방법의 타당성을 증명하기 위해 유투브의 영상에 대한 분석을 통해 올바른 범주로 분류된 미디어 데이터를 구성하여 제안하는 시스템의 타당성을 증명하였다.

키워드

온톨로지 모델링;서술논리;추론;순서기반 규칙 추론;자동 분류

참고문헌

  1. J.H. Choi, S.C. Kim, Y.T. Park, "Ontology Representation for Personal Media Management," Proc. of the KIISE Korea Computer Congress 2008, pp. 98-99, 2008. (in Korean)
  2. LIPTON, Alan J.; FUJIYOSHI, Hironobu; PATIL, Raju S. Moving target classification and tracking from real-time video, In: Applications of Computer Vision, 1998, WACV'98. Proceedings, Fourth IEEE Workshop on. IEEE, pp. 8-14, 1998.
  3. Krotzsch, Markus, Frantisek Simancik, and Ian Horrocks, "A description logic primer," arXiv preprint arXiv:1201.4089, 2012.
  4. Sirin, Evren, et al., "Pellet: A practical owl-dl reasoner," Web Semantics: science, services and agents on the World Wide Web 5.2, pp. 51-53, 2007. https://doi.org/10.1016/j.websem.2007.03.004
  5. LU, Lie; ZHANG, Hong-Jiang; JIANG, Hao. Content analysis for audio classification and segmentation. Speech and Audio Processing, IEEE Transactions on, 10.7: 504-516, 2002. https://doi.org/10.1109/TSA.2002.804546
  6. YOON, Yong-Ik; CHUN, Jee-Ae, Tracking Model for Abnormal Behavior from Multiple Network CCTV Using the Kalman Filter. In: Computer Science and its Applications. Springer Berlin Heidelberg, pp. 933-939, 2015.
  7. DAVIES, Anthony C.; VELASTIN, Sergio A. Progress in computational intelligence to support cctv surveillance systems, International Journal of Computing, 4.3: 76-84, 2014.
  8. SZEGEDY, Christian; TOSHEV, Alexander; ERHAN, Dumitru. Deep neural networks for object detection, In: Advances in Neural Information Processing Systems, pp. 2553-2561, 2013.
  9. LI, Dongge, et al. Classification of general audio data for content-based retrieval, Pattern recognition letters, 22.5: 533-544, 2001. https://doi.org/10.1016/S0167-8655(00)00119-7
  10. MANDEL, Michael I.; ELLIS, Daniel PW. Songlevel features and support vector machines for music classification, In: ISMIR 2005: 6th International Conference on Music Information Retrieval: Proceedings: Variation 2: Queen Mary, University of London & Goldsmiths College, University of London, 11-15 September, 2005, Queen Mary, University of London, pp. 594-599, 2005.
  11. S. Espinosa, A. Kaya, S. Melzer, R. Moller, and M. Wessel, Towards a media interpretation framework for the semantic web, In The 2007 IEEE/WIC/ACM International Conference on Web Intelligence (WI'07), Fremont, USA, pp. 374-380, 2007.

과제정보

연구 과제번호 : 현장전문가의 경험지식 획득 및 활용을 위한 경험지식플랫폼 개발 연구

연구 과제 주관 기관 : 한국산업기술평가관리원