DOI QR코드

DOI QR Code

An Automatic ROI Extraction and Its Mask Generation based on Wavelet of Low DOF Image

피사계 심도가 낮은 이미지에서 웨이블릿 기반의 자동 ROI 추출 및 마스크 생성

  • 박순화 (경상대학교 컴퓨터과학과, 컴.정보통신연구원) ;
  • 서영건 (경상대학교 컴퓨터교육과, 컴.정보통신연구원) ;
  • 이부권 (경상대학교 컴퓨터과학과, 컴.정보통신연구원) ;
  • 강기준 (경상대학교 컴퓨터과학과, 컴.정보통신연구원) ;
  • 김호용 (영진전문대학 컴퓨터정보기술계열) ;
  • 김형준 (경상대학교 컴퓨터과학과, 컴.정보통신연구원) ;
  • 김상복 (경상대학교 컴퓨터과학과, 컴.정보통신연구원)
  • Published : 2009.03.31

Abstract

This paper suggests a new algorithm automatically searching for Region-of-Interest(ROI) with high speed, using the edge information of high frequency subband transformed with wavelet. The proposed method executes a searching algorithm of 4-direction object boundary by the unit of block using the edge information, and detects ROIs. The whole image is splitted by $64{\times}64$ or $32{\times}32$ sized blocks and the blocks can be ROI block or background block according to taking the edges or not. The 4-directions searche the image from the outside to the center and the algorithm uses a feature that the low-DOF image has some edges as one goes to center. After searching all the edges, the method regards the inner blocks of the edges as ROI, and makes the ROI masks and sends them to server. This is one of the dynamic ROI method. The existing methods have had some problems of complicated filtering and region merge, but this method improved considerably the problems. Also, it was possible to apply to an application requiring real-time processing caused by the process of the unit of block.

본 논문에서는 웨이블릿 변환 된 고주파 서브밴드들의 에지 정보를 이용하여 관심 객체 영역을 고속으로 자동 검출해주는 새로운 알고리즘을 제안하였다. 제안된 방법에서는 에지정보를 이용하여 블록단위의 4-방향 객체 윤곽탐색 알고리즘(4-DOBS)을 수행하여 관심객체를 검출한다. 전체 이미지는 $64{\times}64$또는 $32{\times}32$ 크기의 코드 블록으로 먼저 나누어지고, 각 코드 블록 내에 에지들이 있는지 없는지에 따라 관심 코드블록 또는 배경이 된다. 4-방향은 바깥쪽에서 이미지의 중앙으로 탐색하고, 피사계 심도가 낮은 이미지는 중앙으로 갈수록 에지가 발견된다는 특징을 이용한다. 에지를 모두 발견하면 내부의 이미지 블록은 모두 관심영역으로 간주하고, 이 블록들은 빠르게 마스킹되어 서버로 전송되어 동적 ROI를 제공한다. 이는 기존 방법들의 문제점이였던 복잡한 필터링 과정과 영역병합 문제로 인한 높은 계산 복잡도를 상당히 개선시킬 수 있었고, 블록 단위의 처리로 인하여 실시간 처리를 요하는 응용에서도 적용 가능하였다.

Keywords

References

  1. O. T. Chen and C. C. Chen, "Automatically Determined Region of Interest in JPEG 2000," Multimedia, IEEE Trans, Vol. 9-7, pp. 1333-1345, Nov. 2007.
  2. C. Kim, "Segmenting a low-depth-of-field Image Using Morphological Filters and Region Merging," IEEE Trans, Image Processing, Vol.14-10, pp. 1503-1511, Oct. 2005.
  3. C. S. Won, K. Pyun and R. M. Gray, "Automatic Oject Segmentation in Images with low depth of Field," 2002 International Conf. Image Processing. Vol. 3-24-28, pp. 805-808, June 2002.
  4. 박재흥, 서영건, 김상복, 강기준, 김호용, "JPEG2000에서 ROI의 자동 추출과 우선적 처리." 한국컴퓨터정보학회 논문지, 제13권 5호, 127-136쪽, 2008년 11월
  5. D. M. Tsai and H. J. Wang, "Segmenting Focused Objects in Complex Visual Images," Pattern Recognition Letters, vol. 19, pp. 929-940, 1998. https://doi.org/10.1016/S0167-8655(98)00078-6
  6. A Graps, "An Introduction to Wavelets," Computational Science & Engineering, IEEE Vol. 2-2, pp. 50-61, Summer 1995.
  7. 강기준, 서영건, "JPEG2000의 관심영역 부호화를 위한 적응적인 관심영역 마스크 생성 방법," 한국컴퓨터정보학회 논문지, 제12권 5호, 39-47쪽, 2007년 11월.
  8. 강기준, 이점숙, 김현주, "A Performance Evaluation of Factors Influencing the ROI Coding Quality in JPEG2000", 한국컴퓨터정보학회 논문지, 제11권 4호, 197-206쪽, 2006년 1월.
  9. J. Z. Wang, J. Li and R. M. Gray, "Unsupervised Multiresolution Segmentation for Images with low depth of Field," Pattern Analysis and Machine Intelligence, IEEE Trans., Vol. 23, pp. 85-90, Jan. 2001. https://doi.org/10.1109/34.899949
  10. B. Zoran and S. Andreja, "Face Detection Approach in Neural Network Based Method for Video Surveillance," Neural Network Applications in Electrical Engineering, NEUREL 2006. pp. 44-47, Sep. 2006.
  11. R. L. Joshi, H. Jafarkhani, J. H. Kasner, T. R. Fischer, N. Farvardin, M. W. Marcellin, and R. H. Bamberger, "Comparion of Different Methods of Classification in Subband Coding of Images," IEEE Trans. Image Processing, Vol. 6-11, pp. 1473-1486, Nov. 1997.
  12. Y. Yoo, A. Ortega and B. Yu, "Image Subband Coding using Context-based Classification and Adaptive Quantization," IEEE Trans. Image Processing, Vol. 8-12, pp. 1702-1715, Dec, 1990.