• 제목/요약/키워드: machine learning

검색결과 5,164건 처리시간 0.039초

A comparison of ATR-FTIR and Raman spectroscopy for the non-destructive examination of terpenoids in medicinal plants essential oils

  • Rahul Joshi;Sushma Kholiya;Himanshu Pandey;Ritu Joshi;Omia Emmanuel;Ameeta Tewari;Taehyun Kim;Byoung-Kwan Cho
    • 농업과학연구
    • /
    • 제50권4호
    • /
    • pp.675-696
    • /
    • 2023
  • Terpenoids, also referred to as terpenes, are a large family of naturally occurring chemical compounds present in the essential oils extracted from medicinal plants. In this study, a nondestructive methodology was created by combining ATR-FT-IR (attenuated total reflectance-Fourier transform infrared), and Raman spectroscopy for the terpenoids assessment in medicinal plants essential oils from ten different geographical locations. Partial least squares regression (PLSR) and support vector regression (SVR) were used as machine learning methodologies. However, a deep learning based model called as one-dimensional convolutional neural network (1D CNN) were also developed for models comparison. With a correlation coefficient (R2) of 0.999 and a lowest RMSEP (root mean squared error of prediction) of 0.006% for the prediction datasets, the SVR model created for FT-IR spectral data outperformed both the PLSR and 1 D CNN models. On the other hand, for the classification of essential oils derived from plants collected from various geographical regions, the created SVM (support vector machine) classification model for Raman spectroscopic data obtained an overall classification accuracy of 0.997% which was superior than the FT-IR (0.986%) data. Based on the results we propose that FT-IR spectroscopy, when coupled with the SVR model, has a significant potential for the non-destructive identification of terpenoids in essential oils compared with destructive chemical analysis methods.

An advanced machine learning technique to predict compressive strength of green concrete incorporating waste foundry sand

  • Danial Jahed Armaghani;Haleh Rasekh;Panagiotis G. Asteris
    • Computers and Concrete
    • /
    • 제33권1호
    • /
    • pp.77-90
    • /
    • 2024
  • Waste foundry sand (WFS) is the waste product that cause environmental hazards. WFS can be used as a partial replacement of cement or fine aggregates in concrete. A database comprising 234 compressive strength tests of concrete fabricated with WFS is used. To construct the machine learning-based prediction models, the water-to-cement ratio, WFS replacement percentage, WFS-to-cement content ratio, and fineness modulus of WFS were considered as the model's inputs, and the compressive strength of concrete is set as the model's output. A base extreme gradient boosting (XGBoost) model together with two hybrid XGBoost models mixed with the tunicate swarm algorithm (TSA) and the salp swarm algorithm (SSA) were applied. The role of TSA and SSA is to identify the optimum values of XGBoost hyperparameters to obtain the higher performance. The results of these hybrid techniques were compared with the results of the base XGBoost model in order to investigate and justify the implementation of optimisation algorithms. The results showed that the hybrid XGBoost models are faster and more accurate compared to the base XGBoost technique. The XGBoost-SSA model shows superior performance compared to previously published works in the literature, offering a reduced system error rate. Although the WFS-to-cement ratio is significant, the WFS replacement percentage has a smaller influence on the compressive strength of concrete. To improve the compressive strength of concrete fabricated with WFS, the simultaneous consideration of the water-to-cement ratio and fineness modulus of WFS is recommended.

시계열 데이터 활용에 관한 동향 연구 (A Study on Trend Using Time Series Data)

  • 최신형
    • 산업과 과학
    • /
    • 제3권1호
    • /
    • pp.17-22
    • /
    • 2024
  • 인류의 출현과 함께 시작된 역사에는 기록이라는 수단이 있기에 현재에 사는 우리는 데이터를 통해 과거를 확인할 수 있다. 생성되는 데이터는 일정 순간에만 발생하여 저장될 수도 있지만, 과거로부터 현재까지 일정 시간 간격 동안 계속해서 생성될 뿐만 아니라 다가올 미래에도 발생함으로써 이를 활용하여 예측하는 것 또한 중요한 작업이다. 본 논문은 수많은 데이터 중에서 시계열 데이터의 활용 동향을 알아보기 위해서 시계열 데이터의 개념에서부터 머신러닝 분야에서 시계열 데이터 분석에 주로 사용되는 Recurrent Neural Network와 Long-Short Term Memory에 대해 분석하고, 이런 모델들을 활용한 사례의 조사를 통해 의료 진단, 주식 시세 분석, 기후 예측 등 다양한 분야에 활용되어 높은 예측 결과를 보이고 있음을 확인하였고, 이를 바탕으로 향후 활용방안에 대하여 모색해본다.

클러스터링 기법을 이용한 이륜차 사고의 특징 분류 (Classification of Characteristics in Two-Wheeler Accidents Using Clustering Techniques)

  • 허원진;강진호;이소현
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.217-233
    • /
    • 2024
  • 최근 배달문화의 확산으로 이륜차 수요가 증가하면서 이륜차 운행도 함께 증가하고 있다. 이륜차 운행은 혼잡한 교통상황이나 경제적으로 효율적이지만 이륜차 난폭 운전과 명확하게 정립되지 않은 이륜차에 대한 교통 법규로 이륜차 사고는 새로운 사회문제로 나타나고 있다. 이륜차는 차체 특성 상 치사율이 높기 때문에 이륜차 사고가 발생하면 그 심각성 및 위험이 크다. 그러므로, 이륜차 사고에 대한 특성을 분석함으로써 이륜차 사고의 특성을 제대로 파악하는 것이 필요하다. 그리하여, 본 연구에서는 이륜차 사고 데이터를 기반으로 K-prototypes 알고리즘을 이용하여 이륜차 사고의 특성을 분류하였다. 그 결과, 이륜차 사고 특성에 따라 4개의 군집으로 분류되었다. 각 군집마다 사고발생 도로, 주요 위반법규, 사고 유형, 사고 발생 시간 등에서 다른 특성을 나타내었다. 이를 기반으로 이륜차 사고 예방을 위한 구체적인 방안을 제안한다. 각 사고 특성에 따른 단속 방법 및 규율을 개정함으로써 수도권 지역의 이륜차 사고 발생을 최소화하고 궁극적으로는 도로 안전성 향상에 기여한다. 더불어, 머신러닝 기법을 도시교통 및 안전 분야에 적용함으로써 관련 문헌확장에도 기여한다.

Forecasting the Business Performance of Restaurants on Social Commerce

  • Supamit BOONTA;Kanjana HINTHAW
    • 유통과학연구
    • /
    • 제22권4호
    • /
    • pp.11-22
    • /
    • 2024
  • Purpose: This research delves into the various factors that influence the performance of restaurant businesses on social commerce platforms in Bangkok, Thailand. The study considers both internal and external factors, including but not limited to business characteristics and location. Moreover, this research also analyzes the effects of employing multiple social commerce platforms on business efficiency and explores the underlying reasons for such effects. Research design, data, and methodology: Restaurants can be classified into different price ranges: low, medium, and high. To further investigate, we employed natural language processing AI to analyze online reviews and evaluate algorithm performance using machine learning techniques. We aimed to develop a model to gauge customer satisfaction with restaurants across different price categories effectively. Results: According to the research findings, several factors significantly impact restaurant groups in the low and mid-price ranges. Among these factors are population density and the number of seats at the restaurant. On the other hand, in the mid-and high-price ranges, the price levels of the food and drinks offered by the restaurant play a crucial role in determining customer satisfaction. Furthermore, the correlation between different social commerce platforms can significantly affect the business performance of high-price range restaurant groups. Finally, the level of online review sentiment has been found to influence customer decision-making across all restaurant types significantly. Conclusions: The study emphasizes that restaurants' characteristics based on their price level differ significantly, and social commerce platforms have the potential to affect one another. It is worth noting that the sentiment expressed in online reviews has a more significant impact on customer decision-making than any other factor, regardless of the type of restaurant in question.

심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례 분석 (Case Analysis of Applications of Seismic Data Denoising Methods using Deep-Learning Techniques)

  • 조준현;하완수
    • 지구물리와물리탐사
    • /
    • 제23권2호
    • /
    • pp.72-88
    • /
    • 2020
  • 최근 컴퓨터 하드웨어 성능의 급속한 발전으로 인해 계산 비용이 상대적으로 낮아지면서 기계 학습 기법을 지구물리학적 문제에 적용하는 사례가 점차 증가하고 있다. 특히 심층 학습 기법이 복잡하고 비선형적인 문제를 성공적으로 해결하는 사례가 많아지면서 큰 인기를 얻고 있다. 이 논문에서는 심층 학습 기법을 이용한 탄성파 자료 잡음 제거 적용사례를 조사하고 소개하였다. 감쇠하고자 하는 잡음 유형에 따라 일관성 잡음 적용사례, 무작위 잡음 적용사례, 일관성 잡음 및 무작위 잡음 적용사례로 분류하였고 해당 잡음 제거에 사용된 심층 학습 기법에 대해 조사하였다. 대표적인 심층 학습 기법인 심층 신경망은 탄성파 잡음 제거에 사용된 기존 기법과 달리 잡음의 특징을 스스로 학습하며 매개변수를 자동으로 최적화한다. 따라서 기존 기법에 비해 일반화 문제에 덜 민감하며 인적 비용을 절감할 수 있다. 또한 여러 연구 사례를 통해 계산 비용이나 잡음 제거 성능 측면에서도 심층 학습 기법이 뛰어난 성과를 달성하는 것을 보여주었다. 연구 결과들을 토대로 탄성파 잡음 제거에 사용된 심층 학습 기법의 장단점에 대해 분석하고 논의하였다.

비전공자 대상 인공지능 체험교육 수업 설계 및 적용 (Design and Application of Artificial Intelligence Experience Education Class for Non-Majors)

  • 피수영
    • 실천공학교육논문지
    • /
    • 제15권2호
    • /
    • pp.529-538
    • /
    • 2023
  • 보편적 인공지능교육의 필요성이 확대되고 직무 변화가 이루어지고 있는 현 시점에서, 가장 먼저 인공지능을 직무의 일부분으로 경험하게 되는 대학의 비전공자를 위한 인공지능 교양교육에 대한 연구 및 논의는 미흡한 실정이다. 비전공자 대상 인공지능 교육과정이 운영되고 있지만 주로 인공지능의 개념 및 원리에 대한 이론 중심의 교육으로 운영되고 있다. 비전공자 대상 인공지능에 대한 일반적인 개념을 이해하기 위해 체험학습을 병행하여 진행 할 필요가 있다. 따라서 본 연구는 비전공자의 특성을 고려하여 학습에 흥미를 갖고, 인공지능 수업에 대한 부담감을 낮출 수 있는 난이도의 인공지능 체험교육 학습콘텐츠를 설계한 후 앱인벤터와 오렌지 인공지능 플랫폼을 활용한 체험 교육의 학습효과를 살펴보고자 한다. 팀 별 인공지능 관련 프로젝트 작성을 통해 수집된 학습관련 데이터와 설문조사 자료를 바탕으로 분석한 결과 인공지능 교육의 필요성에 대한 인식의 긍정적인 변화와 인공지능 리터러시 능력이 향상된 것으로 나타났다. 교수자에게는 인공지능 체험교육 학습을 위한 학습모형을 설계하는 데 기틀을 마련해 주는 계기가 될 것으로 기대한다.

다각형 용기의 품질 향상을 위한 딥러닝 구조 개발 (Development of Deep Learning Structure to Improve Quality of Polygonal Containers)

  • 윤석문;이승호
    • 전기전자학회논문지
    • /
    • 제25권3호
    • /
    • pp.493-500
    • /
    • 2021
  • 본 논문에서는 다각형 용기의 품질 향상을 위한 딥러닝 구조 개발을 제안한다. 딥러닝 구조는 convolution 층, bottleneck 층, fully connect 층, softmax 층 등으로 구성된다. Convolution 층은 입력 이미지 또는 이전 층의 특징 이미지를 여러 특징 필터와 convolution 3x3 연산하여 특징 이미지를 얻어 내는 층이다. Bottleneck 층은 convolution 층을 통해 추출된 특징 이미지상의 특징들 중에서 최적의 특징들만 선별하여 convolution 1x1 ReLU로 채널을 감소시키고convolution 3x3 ReLU를 실시한다. Bottleneck 층을 거친 후에 수행되는 global average pooling 연산과정은 convolution 층을 통해 추출된 특징 이미지의 특징들 중에서 최적의 특징들만 선별하여 특징 이미지의 크기를 감소시킨다. Fully connect 층은 6개의 fully connect layer를 거쳐 출력 데이터가 산출된다. Softmax 층은 입력층 노드의 값과 연산을 진행하려는 목표 노드 사이의 가중치와 곱을 하여 합하고 활성화 함수를 통해 0~1 사이의 값으로 변환한다. 학습이 완료된 후에 인식 과정에서는 학습 과정과 마찬가지로 카메라를 이용한 이미지 획득, 측정 위치 검출, 딥러닝을 활용한 비원형 유리병 분류 등을 수행하여 비원형 유리병을 분류한다. 제안된 다각형 용기의 품질 향상을 위한 딥러닝 구조의 성능을 평가하기 위하여 공인시험기관에서 실험한 결과, 양품/불량 판별 정확도 99%로 세계최고 수준과 동일한 수준으로 산출되었다. 검사 소요 시간은 평균 1.7초로 비원형 머신비전 시스템을 사용하는 생산 공정의 가동 시간 기준 내로 산출되었다. 따라서 본 본문에서 제안한 다각형 용기의 품질 향상을 위한 딥러닝 구조의 성능의 그 효용성이 입증되었다.

GOCI 위성영상과 기계학습을 이용한 한반도 연안 수질평가지수 추정 (Estimation of Water Quality Index for Coastal Areas in Korea Using GOCI Satellite Data Based on Machine Learning Approaches)

  • 장은나;임정호;하성현;이상균;박영규
    • 대한원격탐사학회지
    • /
    • 제32권3호
    • /
    • pp.221-234
    • /
    • 2016
  • 우리나라는 대규모 산업단지와 대도시들이 연안에 집중되면서 연안의 오염이 날로 심각해지고 있다. 이러한 연안 오염을 모니터링하기 위해서 위성 영상을 이용한 연안 수질평가지수 모니터링 연구가 수행될 필요가 있다. 수질평가지수란 저층 산소포화도, 엽록소 농도, 투명도, 용존무기질소 및 용존무기인 농도를 수질평가 항목으로 구성하여 해양환경관리법에 따른 해양환경기준을 통해 해역별로 기준을 설정하여 산출하는 지수이다. 이 연구는 한반도 주변의 연안지역을 대상으로 2011년부터 2013년까지의 현장관측 자료 및 Geostationary Ocean Color Imager (GOCI) 위성 영상을 이용하여 연안 표층 해수에 대한 기계학습 기반의 두 가지 수질평가지수 추정 기법을 개발하였다. 첫 번째 방법으로는 GOCI 반사도를 이용하여 추정된 수질평가 항목들로 수질평가지수를 계산하였고, 두 번째 방법은 GOCI 반사도 및 산출물(엽록소 농도, 총 부유물질, 용존유기물)을 이용하여 수질평가지수를 추정하였다. 기계학습으로는 Random Forest(RF), Support Vector Regression (SVR), Cubist를 사용하였다. 수질평가 항목 추정에서 투명도의 정확도가 가장 높게 나타났으며, 모든 수질평가 항목 추정에서 세 가지 기계학습 중 RF의 정확도가 가장 높았다. 하지만 추정된 수질평가 항목들로 계산한 수질평가지수는 추정된 수질평가 항목들의 오차와 저층 산소포화도의 불확실성으로 인해 정확도가 높지는 않았다. 반면 GOCI 반사도와 산출물을 이용하여 추정한 수질평가지수는 현장 관측 기반 수질평가지수와 비교했을 때 첫 번째 방법보다 정확도가 높게 나타났다. 또한 엽록소 농도가 수질평가지수 추정에 가장 중요한 변수로 나타났다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.