• 제목/요약/키워드: ART2 algorithm

검색결과 220건 처리시간 0.024초

SuperDepthTransfer: Depth Extraction from Image Using Instance-Based Learning with Superpixels

  • Zhu, Yuesheng;Jiang, Yifeng;Huang, Zhuandi;Luo, Guibo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.4968-4986
    • /
    • 2017
  • In this paper, we primarily address the difficulty of automatic generation of a plausible depth map from a single image in an unstructured environment. The aim is to extrapolate a depth map with a more correct, rich, and distinct depth order, which is both quantitatively accurate as well as visually pleasing. Our technique, which is fundamentally based on a preexisting DepthTransfer algorithm, transfers depth information at the level of superpixels. This occurs within a framework that replaces a pixel basis with one of instance-based learning. A vital superpixels feature enhancing matching precision is posterior incorporation of predictive semantic labels into the depth extraction procedure. Finally, a modified Cross Bilateral Filter is leveraged to augment the final depth field. For training and evaluation, experiments were conducted using the Make3D Range Image Dataset and vividly demonstrate that this depth estimation method outperforms state-of-the-art methods for the correlation coefficient metric, mean log10 error and root mean squared error, and achieves comparable performance for the average relative error metric in both efficacy and computational efficiency. This approach can be utilized to automatically convert 2D images into stereo for 3D visualization, producing anaglyph images that are visually superior in realism and simultaneously more immersive.

Development and Performance Evaluation of the First Model of 4D CT-Scanner

  • Endo, Masahiro;Mori, Shinichiro;Tsunoo, Takanori;Kandatsu, Susumu;Tanada, Shuji;Aradate, Hiroshi;Saito, Yasuo;Miyazaki, Hiroaki;Satoh, Kazumasa;Matsusita, Satoshi;Kusakabe, Masahiro
    • 한국의학물리학회:학술대회논문집
    • /
    • 한국의학물리학회 2002년도 Proceedings
    • /
    • pp.373-375
    • /
    • 2002
  • 4D CT is a dynamic volume imaging system of moving organs with an image quality comparable to conventional CT, and is realized with continuous and high-speed cone-beam CT. In order to realize 4D CT, we have developed a novel 2D detector on the basis of the present CT technology, and mounted it on the gantry frame of the state-of-the-art CT-scanner. In the present report we describe the design of the first model of 4D CT-scanner as well as the early results of performance test. The x-ray detector for the 4D CT-scanner is a discrete pixel detector in which pixel data are measured by an independent detector element. The numbers of elements are 912 (channels) ${\times}$ 256 (segments) and the element size is approximately 1mm ${\times}$ 1mm. Data sampling rate is 900views(frames)/sec, and dynamic range of A/D converter is 16bits. The rotation speed of the gantry is l.0sec/rotation. Data transfer system between rotating and stationary parts in the gantry consists of laser diode and photodiode pairs, and achieves net transfer speed of 5Gbps. Volume data of 512${\times}$512${\times}$256 voxels are reconstructed with FDK algorithm by parallel use of 128 microprocessors. Normal volunteers and several phantoms were scanned with the scanner to demonstrate high image quality.

  • PDF

멀티미디어 DSP를 위한 AVS 비디오 복호화기 구현 (AVS Video Decoder Implementation for Multimedia DSP)

  • 강대범;심동규
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.151-161
    • /
    • 2009
  • Audio Video Standard (AVS)는 중국내의 멀티미디어 응용기기를 위해 개발된 오디오/비디오 압축 표준이다. AVS는 표준화 코덱 중 성능이 가장 우수한 것으로 알려진 H.264/AVC에 비해 낮은 복잡도의 비디오 알고리즘을 사용하면서도 비슷한 RD 성능을 보인다. AVS 비디오 코덱은 VGA급 이상의 영상을 타겟으로 하기 때문에 큰 해상도에서 압축효율이 좋은 $8{\times}8$ 단위 블록의 예측 및 변환 알고리즘을 사용한다. 현재 중국에서 IPTV 및 모바일 애플리케이션을 위한 코덱으로 AVS를 사용하는 비중이 높아지고 있어 국내의 기업 및 연구소에서도 AVS를 위한 애플리케이션 및 칩 개발을 위한 연구가 진행되고 있다. 본 연구에서는 AVS 비디오 복호화기 알고리즘을 분석하고 이를 바탕으로 하여 불필요한 메모리 연산이 없도록 AVS 비디오 복호화기를 구현하고 이를 TI의 Davinci EVM보드에서 최적화하였다. 또한, 제안한 복호화기에 고속의 VLD 알고리즘을 적용하고 linear assembly로 디블록킹 필터를 구현하는 등 DSP에 적합하도록 최적화를 진행하였다. 이를 통해 AVS의 참조 소프트웨어인 RM 5.2J 복호화기와 비교하여 $500%{\sim}700%$의 복호 속도 향상을 이루었다.

곤충 발자국 패턴 인식을 위한 Trace Transform 기반의 특징값 추출 (Feature Extraction Using Trace Transform for Insect Footprint Recognition)

  • 신복숙;조경원;차의영
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1095-1100
    • /
    • 2008
  • 이 논문에서는 곤충 발자국의 패턴을 인식하기 위해, 인식의 기본 단위인 세그먼트를 자동 추출하는 기법과 Trace transform을 이용하여 발자국 인식에 필요한 특징을 추출하는 기법을 제안하였다. Trace transform 방법을 이용하면 패턴의 이동, 회전, 반사에 불변하는 특징 값을 얻을 수 있다. 이러한 특징 값들은 곤충 발자국과 같이 다양한 변형이 존재하는 패턴을 인식하는 데에 적합하다. 특징 값을 도출하기 위한 첫 번째 단계로는 추출된 세그먼트에 대한 Trace transform을 통해 새로운 Trace 이미지를 생성시킨다. 그런 다음, 병렬로 표현되는 trace-line을 따라 특성 함수에 의해 특징들이 일차적으로 도출되고, 또 다시 도출된 특징들은 diametric, circus 단계의 함수를 거치면서 새로운 특징값으로 재구성된다. 2가지 서로 다른 곤충의 발자국 패턴을 이용하여 실험한 결과 곤충 발자국의 이동, 회전, 반사에 관계없이 인식에 적합한 특징 값들이 추출됨을 확인할 수 있었다.

Complexity Estimation Based Work Load Balancing for a Parallel Lidar Waveform Decomposition Algorithm

  • Jung, Jin-Ha;Crawford, Melba M.;Lee, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제25권6호
    • /
    • pp.547-557
    • /
    • 2009
  • LIDAR (LIght Detection And Ranging) is an active remote sensing technology which provides 3D coordinates of the Earth's surface by performing range measurements from the sensor. Early small footprint LIDAR systems recorded multiple discrete returns from the back-scattered energy. Recent advances in LIDAR hardware now make it possible to record full digital waveforms of the returned energy. LIDAR waveform decomposition involves separating the return waveform into a mixture of components which are then used to characterize the original data. The most common statistical mixture model used for this process is the Gaussian mixture. Waveform decomposition plays an important role in LIDAR waveform processing, since the resulting components are expected to represent reflection surfaces within waveform footprints. Hence the decomposition results ultimately affect the interpretation of LIDAR waveform data. Computational requirements in the waveform decomposition process result from two factors; (1) estimation of the number of components in a mixture and the resulting parameter estimates, which are inter-related and cannot be solved separately, and (2) parameter optimization does not have a closed form solution, and thus needs to be solved iteratively. The current state-of-the-art airborne LIDAR system acquires more than 50,000 waveforms per second, so decomposing the enormous number of waveforms is challenging using traditional single processor architecture. To tackle this issue, four parallel LIDAR waveform decomposition algorithms with different work load balancing schemes - (1) no weighting, (2) a decomposition results-based linear weighting, (3) a decomposition results-based squared weighting, and (4) a decomposition time-based linear weighting - were developed and tested with varying number of processors (8-256). The results were compared in terms of efficiency. Overall, the decomposition time-based linear weighting work load balancing approach yielded the best performance among four approaches.

훼손된 금석문 판독시스템 개발 - 해서체를 중심으로 - (The Development of the Recovery System of the Destroyed Epigraph - Focused on the Chinese standard script -)

  • 장선필
    • 헤리티지:역사와 과학
    • /
    • 제50권2호
    • /
    • pp.80-93
    • /
    • 2017
  • 본 연구는 훼손된 금석문의 과학적 판독방법을 제시하기 위한 것이다. 이를 위해 한자를 좌표화하였다. 좌표화한 글자의 부분에서 온전히 남은 부분과 훼손된 부분이 존재하는 다른 글자를 찾아 부분적인 훼손글자를 판독하는 방법이다. 부수의 위치에 따라 한자를 9칸으로 나누었으며 9칸에 해당하는 글자의 형태를 검색하여 해당글자를 찾아가는 방식이다. 이는 기존의 문맥을 통한 판독보다 과학적이며 판독글자 외에도 후보글자를 파악할 수 있어 보다 정확한 판독을 가능하게 해준다. 이 알고리즘을 바탕으로 소프트웨어를 만든다면 현재 사용되지 않는 고한자(古漢字; 과거에 사용되었으나 현재는 사용되지 않는 한자)를 판독하는 고문서나 금석문 판독에 유용하게 사용될 수 있을 것이다. 앞으로 행서나 초서 역시 같은 방법으로 후속 연구를 진행한다면 금석문 판독 및 훼손글자 판독에 큰 도움이 될 것으로 생각한다.

A Study on the Automated Payment System for Artificial Intelligence-Based Product Recognition in the Age of Contactless Services

  • Kim, Heeyoung;Hong, Hotak;Ryu, Gihwan;Kim, Dongmin
    • International Journal of Advanced Culture Technology
    • /
    • 제9권2호
    • /
    • pp.100-105
    • /
    • 2021
  • Contactless service is rapidly emerging as a new growth strategy due to consumers who are reluctant to the face-to-face situation in the global pandemic of coronavirus disease 2019 (COVID-19), and various technologies are being developed to support the fast-growing contactless service market. In particular, the restaurant industry is one of the most desperate industrial fields requiring technologies for contactless service, and the representative technical case should be a kiosk, which has the advantage of reducing labor costs for the restaurant owners and provides psychological relaxation and satisfaction to the customer. In this paper, we propose a solution to the restaurant's store operation through the unmanned kiosk using a state-of-the-art artificial intelligence (AI) technology of image recognition. Especially, for the products that do not have barcodes in bakeries, fresh foods (fruits, vegetables, etc.), and autonomous restaurants on highways, which cause increased labor costs and many hassles, our proposed system should be very useful. The proposed system recognizes products without barcodes on the ground of image-based AI algorithm technology and makes automatic payments. To test the proposed system feasibility, we established an AI vision system using a commercial camera and conducted an image recognition test by training object detection AI models using donut images. The proposed system has a self-learning system with mismatched information in operation. The self-learning AI technology allows us to upgrade the recognition performance continuously. We proposed a fully automated payment system with AI vision technology and showed system feasibility by the performance test. The system realizes contactless service for self-checkout in the restaurant business area and improves the cost-saving in managing human resources.

적외선 비디오에서 Gain과 Offset 결합 보정을 통한 고정패턴잡음 제거기법 (Fixed Pattern Noise Reduction in Infrared Videos Based on Joint Correction of Gain and Offset)

  • 김성민;배윤성;장재호;나종범
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.35-44
    • /
    • 2012
  • 대부분의 최근 적외선 센서는 focal-plane array (FPA) 구조로 되어있다. 이러한 구조의 센서는 공간적 불균일 응답성을 갖는 것으로 알려져 있고, 이로 인해 고정패턴잡음을 발생시킴으로써 영상열화를 가져온다. 따라서 적외선 영상의 고정패턴잡음을 제거하기 위해서는 픽셀 불균일 보정을 해야 한다. 픽셀 불균일 보정기법은 참조물체기반 접근법과 영상기반 접근법으로 나눌 수 있다. 참조물체기반 접근법에서는 흑체와 같은 균일한 온도를 갖는 물체를 이용해서 고정패턴잡음을 분리시킬 수 있는 방법이다. 하지만 센서의 응답성은 시간이 지나면서 변할 수 있기 때문에, 최근에는 비디오 영상을 이용하는 영상기반 접근법이 많이 연구되고 있다. 영상기반 접근법들 중에서 칼만 필터를 기반으로 하는 최신 알고리듬은 영상 간에 움직임 보상 시에 한 방향 워핑을 이용하고 센서의 offset 불균일성만을 보상해준다. 하지만 한 방향 워핑을 이용한 시스템 모델은 영상의 경계 부근에서 고정패턴잡음을 효과적으로 제거하지 못한다. 게다가, offset만 보정하는 접근법은 gain의 불균일성의 영향을 많이 받는 영상에서는 성능이 악화될 수 있다. 그러므로 본 논문에서는 양방향 워핑을 이용하여 시스템 모델링을 하고, gain과 offset의 결합 보정을 수행하는 알고리듬을 제안한다. 모사 영상과 실제 영상에 대한 실험 결과들은 제안하는 알고리듬이 기존 알고리듬들보다 더 효과적으로 고정패턴잡음을 제거하는 것을 확인할 수 있다.

A comparative study of low-complexity MMSE signal detection for massive MIMO systems

  • Zhao, Shufeng;Shen, Bin;Hua, Quan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1504-1526
    • /
    • 2018
  • For uplink multi-user massive MIMO systems, conventional minimum mean square error (MMSE) linear detection method achieves near-optimal performance when the number of antennas at base station is much larger than that of the single-antenna users. However, MMSE detection involves complicated matrix inversion, thus making it cumbersome to be implemented cost-effectively and rapidly. In this paper, we first summarize in detail the state-of-the-art simplified MMSE detection algorithms that circumvent the complicated matrix inversion and hence reduce the computation complexity from ${\mathcal{O}}(K^3)$ to ${\mathcal{O}}(K^2)$ or ${\mathcal{O}}(NK)$ with some certain performance sacrifice. Meanwhile, we divide the simplified algorithms into two categories, namely the matrix inversion approximation and the classical iterative linear equation solving methods, and make comparisons between them in terms of detection performance and computation complexity. In order to further optimize the detection performance of the existing detection algorithms, we propose more proper solutions to set the initial values and relaxation parameters, and present a new way of reconstructing the exact effective noise variance to accelerate the convergence speed. Analysis and simulation results verify that with the help of proper initial values and parameters, the simplified matrix inversion based detection algorithms can achieve detection performance quite close to that of the ideal matrix inversion based MMSE algorithm with only a small number of series expansions or iterations.

u-City응용에서의 시간 패턴을 이용한 단기 전력 부하 예측 (Short-term Power Load Forecasting using Time Pattern for u-City Application)

  • 박성승;손호선;이동규;지은미;김희석;류근호
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.177-181
    • /
    • 2009
  • u-City 활용을 위한 u-공공시설의 개발은 첨단 건축기술과 유비쿼터스 컴퓨팅의 통합으로 새로운 형식의 공간계획과 공공시설물을 내외부에 설치하기 위해 건물의 기반 서비스 시설인 냉난방, 공조, 조명 그리고 전력 관련 시설들의 기반이 구축되어야 한다. 따라서 이 논문에서는 이러한 기반 서비스를 위한 가장 기본적인 것 중 하나인 단기 전력 시스템의 수요와 공급 문제를 해결하기 위하여 시계열 분석을 적용한 시간 패턴 분석을 통해 전력 수요 예측 기술을 제안한다. 시간 패턴 분석을 위해 SOM 알고리즘과 k-means 기법을 적용하여 요일별, 시간별 데이터를 군집화하고 그 자료를 이용하여 시간 패턴 분석 방법인 지수평활기법과 ARIMA 모형을 비교 분석하였다. 제안 시스템 성능 평가 결과 지수평활기법 보다 ARIMA 모형을 적용한 시스템이 더 좋은 결과를 보였다. 따라서, 이러한 전력 부하 예측 결과를 이용하여 전력 공급의 수요에 따른 계획이나 시스템 운영을 효과적으로 할 수 있다.

  • PDF