• Title, Summary, Keyword: 기계학습

Search Result 2,086, Processing Time 0.057 seconds

Machine Learning-based Quality Control and Error Correction Using Homogeneous Temporal Data Collected by IoT Sensors (IoT센서로 수집된 균질 시간 데이터를 이용한 기계학습 기반의 품질관리 및 데이터 보정)

  • Kim, Hye-Jin;Lee, Hyeon Soo;Choi, Byung Jin;Kim, Yong-Hyuk
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.4
    • /
    • pp.17-23
    • /
    • 2019
  • In this paper, quality control (QC) is applied to each meteorological element of weather data collected from seven IoT sensors such as temperature. In addition, we propose a method for estimating the data regarded as error by means of machine learning. The collected meteorological data was linearly interpolated based on the basic QC results, and then machine learning-based QC was performed. Support vector regression, decision table, and multilayer perceptron were used as machine learning techniques. We confirmed that the mean absolute error (MAE) of the machine learning models through the basic QC is 21% lower than that of models without basic QC. In addition, when the support vector regression model was compared with other machine learning methods, it was found that the MAE is 24% lower than that of the multilayer neural network and 58% lower than that of the decision table on average.

RFA: Recursive Feature Addition Algorithm for Machine Learning-Based Malware Classification

  • Byeon, Ji-Yun;Kim, Dae-Ho;Kim, Hee-Chul;Choi, Sang-Yong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.26 no.2
    • /
    • pp.61-68
    • /
    • 2021
  • Recently, various technologies that use machine learning to classify malicious code have been studied. In order to enhance the effectiveness of machine learning, it is most important to extract properties to identify malicious codes and normal binaries. In this paper, we propose a feature extraction method for use in machine learning using recursive methods. The proposed method selects the final feature using recursive methods for individual features to maximize the performance of machine learning. In detail, we use the method of extracting the best performing features among individual feature at each stage, and then combining the extracted features. We extract features with the proposed method and apply them to machine learning algorithms such as Decision Tree, SVM, Random Forest, and KNN, to validate that machine learning performance improves as the steps continue.

A Study on Prediction of Parent School Satisfaction Using Educational Data Mining (교육데이터마이닝을 이용한 학부모 학교 만족도 예측에 관한 연구)

  • Yang, YouugBo;Yu, Heonchang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.244-246
    • /
    • 2018
  • 학습관리시스템의 도입으로 학습자들은 다양한 형태로 학습하게 되고 데이터를 남기게 된다. 교육데이터마이닝은 다양한 형태로 기록되는 교육 데이터를 분석해서 유의미한 정보를 찾아 내는 방법이다. 교육데이터마이님을 활용하면 학생 개인의 학습성과 향상에 도움을 주거나 학습성과 예측 결과를 참고하여 부족한 부분을 지원해 줄 수도 있다. 기존 연구에서는 학습자의 행동 영역 특징이 학습성과에 영향을 끼친다는 것을 검증하기 위하여 나이브 베이즈, 의사결정트리, 신경망 기계학습알고리즘으로 데이터를 분석했다. 따라서 본 연구에서는 기존 연구를 확장하여 학습자의 행동 영역 특징이 학부모 학교 만족도에 영향을 끼치는지 여부를 확인하는 실험을 수행했으며 kNN, 의사결정트리, SVM 기계학습 알고리즘으로 데이터를 분석하였다. 분석결과 학습자의 행동 영역 특정이 학부모 학교 만족도에 영향을 미치는 것을 확인했다.

인체 골격의 정보의 기계학습을 통한 자세 인식 개선 방법

  • Gang, Min-Ju;Ryu, Su-Gyeong;Kim, Na-Yeong;Lee, Ji-Eun;Gang, Je-Won
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • pp.322-325
    • /
    • 2015
  • 본 논문에서는 개선된 자세 인식을 위한 학습을 통한 자세 인식 기법을 제안한다. 제안 자세 인식 기법은 영상의 모든 픽셀 값을 사용하지 않으며 인체의 골격의 위치 정보와 자세의 학습을 기반으로 한다. 최근 자세 인식기법에 다양한 기계 학습 기법을 적용하여 제스처 인식률을 높이는 연구가 진행되고 있지만 실시간 프레임에 적용하는데 한계가 있다. 반면 고차원의 특징점을 추출하여 신경망 학습방식을 이용하면 적은 계산량과 손쉬운 실행이 가능하다. 고차원의 특징점은 깊이 정보로부터 사람의 골격 정보를 이용해 추출하여 차원을 감소시키며 신경망 학습 방식에서는 각 자세에 대한 고차원의 특징점을 이용하여 자세의 학습을 진행한다. 신경망학습은 학습 단계에서는 미리 알려진 자세와 예측된 자세의 비교를 통해 오류를 최소화 하는 방향으로 학습을 진행하며, 판별 단계에서는 새로운 자세를 입력하여 고차원 특징점을 이용한 신경망 학습 기반의 제안 기술의 성능을 평가한다. 실험에 의하면 제안 기법은 약 96%의 자세 인식률을 보이고 자세 인식기법을 동작 인식으로 확장 가능성 또한 보인다.

  • PDF

Feature Selection for Performance Improvement of Android Malware Detection (안드로이드 악성코드 탐지 성능 향상을 위한 Feature 선정)

  • Kim, Hwan-Hee;Ham, Hyo-Sik;Choi, Mi-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.751-753
    • /
    • 2013
  • 안드로이드 플랫폼은 타 모바일 플랫폼보다 보안에 있어서 더 많은 취약점을 안고 있다. 따라서 현재 발생하고 있는 대부분의 모바일 악성코드는 안드로이드 플랫폼에서 발생하고 있다. 현재 악성코드 탐지 기법 중 기계학습을 도입한 방법은 변종 악성코드의 대처에 유연하다. 하지만 기계학습기법은 불필요한 Feature를 학습데이터로 사용할 경우, 오버피팅이 발생하여 전체적인 성능을 저하시킬 수 있다. 본 논문에서는 안드로이드 플랫폼에서 발생하는 리소스를 모니터링하여 Feature vector를 생성하고, Feature-selection 알고리즘을 통하여 Feature의 수에 따라 기계학습 Classifier를 통한 악성코드 탐지의 성능지표를 보인다. 이를 통하여, 기계학습을 통한 악성코드 탐지에서 Feature-selection의 필요성과 중요성을 설명한다.

  • PDF

Coreference Resolution for Korean Using Random Forests (랜덤 포레스트를 이용한 한국어 상호참조 해결)

  • Jeong, Seok-Won;Choi, MaengSik;Kim, HarkSoo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.535-540
    • /
    • 2016
  • Coreference resolution is to identify mentions in documents and is to group co-referred mentions in the documents. It is an essential step for natural language processing applications such as information extraction, event tracking, and question-answering. Recently, various coreference resolution models based on ML (machine learning) have been proposed, As well-known, these ML-based models need large training data that are manually annotated with coreferred mention tags. Unfortunately, we cannot find usable open data for learning ML-based models in Korean. Therefore, we propose an efficient coreference resolution model that needs less training data than other ML-based models. The proposed model identifies co-referred mentions using random forests based on sieve-guided features. In the experiments with baseball news articles, the proposed model showed a better CoNLL F1-score of 0.6678 than other ML-based models.

Fast Detection of Disease in Livestock based on Machine Learning (기계학습을 이용한 가축 질병 조기 발견 방안)

  • Lee, Woongsup;Hwang, Sewoon;Kim, Jonghyun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • /
    • pp.294-297
    • /
    • 2015
  • Recently, big data analysis which is based on machine learning has been gained a lot of attentions in various fields. Especially, agriculture is considered as one promising field that machine learning algorithm can be efficiently utilized and accordingly, lots of works have been done so far. However, most of the researches are focusing on the forecast of weather or analysis of genome, and machine learning algorithm for livestock management, especially which uses individual data of livestocks, e.g., temperature and movement, are not properly investigated yet. In this work, we propose fast abnormal livestock detection algorithm based on machine learning, more specifically expectation maximization, such that livestock which has problem can be efficiently and promptly found. In our proposed scheme, livestocks are divided into two clusters using expectation maximization based on their bionic data and the abnormal livestock can be detected by comparing the size of two clusters. Especially, we divide the case in which single livestock has problem and the case in which livestocks have epidemic such that fast response is enabled when epidemic case. Moreover, our algorithm does not need statistical information.

  • PDF

A Study on automatic assignment of descriptors using machine learning (기계학습을 통한 디스크립터 자동부여에 관한 연구)

  • Kim, Pan-Jun
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.1
    • /
    • pp.279-299
    • /
    • 2006
  • This study utilizes various approaches of machine learning in the process of automatically assigning descriptors to journal articles. The effectiveness of feature selection and the size of training set were examined, after selecting core journals in the field of information science and organizing test collection from the articles of the past 11 years. Regarding feature selection, after reducing the feature set using $x^2$ statistics(CHI) and criteria that prefer high-frequency features(COS, GSS, JAC), the trained Support Vector Machines(SVM) performed the best. With respect to the size of the training set, it significantly influenced the performance of Support Vector Machines(SVM) and Voted Perceptron(VTP). However, it had little effect on Naive Bayes(NB).

Document Autoclustering for Web Agent (웹 에이전트를 위한 문서 자동 분류)

  • 양찬범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.54-56
    • /
    • 1999
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심정보를 학습하고 사용자가 필요로 한느 웹 상의 정보를 제공하는 시스템이다. 웹 에이전트는 사용자의 관심정보를 추출하기 위해서 귀납적 기계학습을 수행한다. 이때, 학습의 효율을 높이기 위해서는 관련이 있는 문서들을 그룹화하여 학습 시스템에 제공하여야 한다. 본 논문에서는 비감독 개념 학습 알고리즘인 COBWEB을 이용하여 사용자가 관심을 표시한 문서들의 분류트리를 생성한다. 분류트리는 귀납적 기계학습 시스템의 입력으로 사용될 수 있는 형태가 아니므로 분류 트리의 분석과 문서 분류 후처리 작업을 통해서 문서 집합을 생성해야 한다. 이를 위해서는 분류트리를 분석하여 초기 클러스터를 생성하고, 유사한 클러스터들의 병합을 수행한다. 본 논문에서 제안하는 문서 자동 분류 방식은 비감독 개념 학습 알고리즘이 생성한 문서 분류 트리의 분석을 통해서 충분한 유사도와 적절한 수의 문서를 포함하는 초기 클러스터를 생성할 수 있다. 그러므로 문서 분류의 후처리 작업인 클러스터의 병합 작업에서 불필요한 작업을 제거함으로서 보다 효과적이고 합리적인 문서 분류 작업을 수행한다.

  • PDF

Improvement of Accuracy of Decision Tree By Reprocessing (재처리를 통한 결정트리의 정확도 개선)

  • Lee, Gye-Sung
    • The KIPS Transactions:PartB
    • /
    • v.10B no.6
    • /
    • pp.593-598
    • /
    • 2003
  • Machine learning organizes knowledge for efficient and accurate reuse. This paper is concerned with methods of concept learning from examples, which glean knowledge from a training set of preclassified ‘objects’. Ideally, training facilitates classification of novel, previously unseen objects. However, every learning system relies on processing and representation assumptions that may be detrimental under certain circumstances. We explore the biases of a well-known learning system, ID3, review improvements, and introduce some improvements of our own, each designed to yield accurate and pedagogically sound classification.