• 제목/요약/키워드: feature selection principles

검색결과 10건 처리시간 0.019초

양자 유전알고리즘을 이용한 특징 선택 및 성능 분석 (Feature Selection and Performance Analysis using Quantum-inspired Genetic Algorithm)

  • 허기수;정현태;박아론;백성준
    • 스마트미디어저널
    • /
    • 제1권1호
    • /
    • pp.36-41
    • /
    • 2012
  • 특징 선택은 패턴 인식의 성능을 향상시키기 위해 부분집합을 구성하는 중요한 문제다. 특징 선택에는 순차 탐색 알고리즘으로부터 확률 기반의 유전 알고리즘까지 다양한 접근 방법이 적용 되었다. 본 연구에서는 특징 선택을 위해 양자 비트, 상태의 중첩 등 양자 컴퓨터 개념을 기반으로 하는 양자 기반 유전 알고리즘(QGA: Quantum-inspired Genetic Algorithm)을 적용하였다. QGA 성능은 전통적인 유전 알고리즘(CGA: Conventional Genetic Algorithm)을 적용한 특징 선택 방법과 분류율 및 평균 특징 개수의 비교를 통해 이루어졌으며, UCI 데이터를 이용한 실험 결과 QGA를 적용한 특징 선택 방법이 CGA를 적용한 경우에 비해 전반적으로 좋은 성능을 보임을 확인 할 수 있었다.

  • PDF

생태계 모방 알고리즘 기반 특징 선택 방법의 성능 개선 방안 (Performance Improvement of Feature Selection Methods based on Bio-Inspired Algorithms)

  • 윤철민;양지훈
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.331-340
    • /
    • 2008
  • 특징 선택은 기계 학습에서 분류의 성능을 높이기 위해 사용되는 방법이다. 여러 방법들이 개발되고 사용되어 오고 있으나, 전체 데이터에서 최적화된 특징 부분집합을 구성하는 문제는 여전히 어려운 문제로 남아있다. 생태계 모방 알고리즘은 생물체들의 행동 원리 등을 기반으로하여 만들어진 진화적 알고리즘으로, 최적화된 해를 찾는 문제에서 매우 유용하게 사용되는 방법이다. 특징 선택 문제에서도 생태계 모방 알고리즘을 이용한 해결방법들이 제시되어 오고 있으며, 이에 본 논문에서는 생태계 모방 알고리즘을 이용한 특징 선택 방법을 개선하는 방안을 제시한다. 이를 위해 잘 알려진 생태계 모방 알고리즘인 유전자 알고리즘(GA)과 파티클 집단 최적화 알고리즘(PSO)을 이용하여 데이터에서 가장분류 성능이 우수한 특징 부분집합을 만들어 내도록 하고, 최종적으로 개별 특징의 사전 중요도를 설정하여 생태계 모방 알고리즘을 개선하는 방법을 제안하였다. 이를 위해 개별 특징의 우수도를 구할 수 있는 mRMR이라는 방법을 이용하였다. 이렇게 설정한 사전 중요도를 이용하여 GA와 PSO의 진화 연산을 수정하였다. 데이터를 이용한 실험을 통하여 제안한 방법들의 성능을 검증하였다. GA와 PSO를 이용한 특징 선택 방법은 그 분류 정확도에 있어서 뛰어난 성능을 보여주었다. 그리고 최종적으로 제시한 사전 중요도를 이용해 개선된 방법은 그 진화 속도와 분류 정확도 면에서 기존의 GA와 PSO 방법보다 더 나아진 성능을 보여주는 것을 확인하였다.

Mitigation of Phishing URL Attack in IoT using H-ANN with H-FFGWO Algorithm

  • Gopal S. B;Poongodi C
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권7호
    • /
    • pp.1916-1934
    • /
    • 2023
  • The phishing attack is a malicious emerging threat on the internet where the hackers try to access the user credentials such as login information or Internet banking details through pirated websites. Using that information, they get into the original website and try to modify or steal the information. The problem with traditional defense systems like firewalls is that they can only stop certain types of attacks because they rely on a fixed set of principles to do so. As a result, the model needs a client-side defense mechanism that can learn potential attack vectors to detect and prevent not only the known but also unknown types of assault. Feature selection plays a key role in machine learning by selecting only the required features by eliminating the irrelevant ones from the real-time dataset. The proposed model uses Hyperparameter Optimized Artificial Neural Networks (H-ANN) combined with a Hybrid Firefly and Grey Wolf Optimization algorithm (H-FFGWO) to detect and block phishing websites in Internet of Things(IoT) Applications. In this paper, the H-FFGWO is used for the feature selection from phishing datasets ISCX-URL, Open Phish, UCI machine-learning repository, Mendeley website dataset and Phish tank. The results showed that the proposed model had an accuracy of 98.07%, a recall of 98.04%, a precision of 98.43%, and an F1-Score of 98.24%.

QuLa: Queue and Latency-Aware Service Selection and Routing in Service-Centric Networking

  • Smet, Piet;Simoens, Pieter;Dhoedt, Bart
    • Journal of Communications and Networks
    • /
    • 제17권3호
    • /
    • pp.306-320
    • /
    • 2015
  • Due to an explosive growth in services running in different datacenters, there is need for service selection and routing to deliver user requests to the best service instance. In current solutions, it is generally the client that must first select a datacenter to forward the request to before an internal load-balancer of the selected datacenter can select the optimal instance. An optimal selection requires knowledge of both network and server characteristics, making clients less suitable to make this decision. Information-Centric Networking (ICN) research solved a similar selection problem for static data retrieval by integrating content delivery as a native network feature. We address the selection problem for services by extending the ICN-principles for services. In this paper we present Queue and Latency, a network-driven service selection algorithm which maps user demand to service instances, taking into account both network and server metrics. To reduce the size of service router forwarding tables, we present a statistical method to approximate an optimal load distribution with minimized router state required. Simulation results show that our statistical routing approach approximates the average system response time of source-based routing with minimized state in forwarding tables.

Data abnormal detection using bidirectional long-short neural network combined with artificial experience

  • Yang, Kang;Jiang, Huachen;Ding, Youliang;Wang, Manya;Wan, Chunfeng
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.117-127
    • /
    • 2022
  • Data anomalies seriously threaten the reliability of the bridge structural health monitoring system and may trigger system misjudgment. To overcome the above problem, an efficient and accurate data anomaly detection method is desiderated. Traditional anomaly detection methods extract various abnormal features as the key indicators to identify data anomalies. Then set thresholds artificially for various features to identify specific anomalies, which is the artificial experience method. However, limited by the poor generalization ability among sensors, this method often leads to high labor costs. Another approach to anomaly detection is a data-driven approach based on machine learning methods. Among these, the bidirectional long-short memory neural network (BiLSTM), as an effective classification method, excels at finding complex relationships in multivariate time series data. However, training unprocessed original signals often leads to low computation efficiency and poor convergence, for lacking appropriate feature selection. Therefore, this article combines the advantages of the two methods by proposing a deep learning method with manual experience statistical features fed into it. Experimental comparative studies illustrate that the BiLSTM model with appropriate feature input has an accuracy rate of over 87-94%. Meanwhile, this paper provides basic principles of data cleaning and discusses the typical features of various anomalies. Furthermore, the optimization strategies of the feature space selection based on artificial experience are also highlighted.

뇌 기억-학습 원리를 적용한 중등영어교사 임용시험 준비용 어플 (An Exam Prep App for the Secondary English Teacher Recruitment Exam with Brain-based Memory and Learning Principles)

  • 이혜진
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.311-320
    • /
    • 2021
  • 현재 국내 국·공립 중등교사가 되기 위한 유일한 등용문은 중등교원 임용시험이며 2014학년도 개정 이후 임용시험의 모든 문항이 서답형으로 전환되었기 때문에 더 완성도 높고 정확하고 견고한 답안 작성이 요구된다. 재인기억을 측정하는 선택형 문항과 비교하면 회상기억을 측정하는 서답형 문항의 경우 정보 인출을 위해 더 많은 인지적 노력이 요구된다. 이 때문에 지속적인 암기 및 인출 연습이 필요하지만 이를 수행할 수 있는 학습 도구가 충분하지 않다. 이러한 맥락에서 본고는 중등영어교사 임용시험 준비용 모바일 어플인 ONE PASS를 구현하였다. 본 어플에서는 특히 인지작용의 근간이 되는 뇌의 작용기제를 반영하여 학습용 콘텐츠를 구현하였으며 학습계획 설정 및 동기측정, 마인드맵, 브레인스토밍, 기출문제 등 다양한 기능을 구안하였다. 본 연구는 학습용 어플 콘텐츠 개발 관련 연구에 이바지함과 동시에 임용시험 수험자들에게 조금이나마 도움이 될 수 있기를 기대한다.

서원의 외부공간 특성 -상주지방의 사례연구- (External Space Characteristics of the Seowon -A case Study of Sangju Area-)

  • 박영달;신영철
    • 한국조경학회지
    • /
    • 제27권3호
    • /
    • pp.18-31
    • /
    • 1999
  • The research deals with external space Seowon(lecture hall) dedicated to education and memorial rises in Sangju area of Choson Dynasty. Characteristics of Seowon as follow; 1. Seowon of Sangju area were built from the middle of 17C to the beginning of 18C. Ideological background of building functioning were grafted into the belief in the three God governing Childbirth, the theory of feng-shui(wind-and water-magic) which is in close connection with the principles of yin and yang, and confucianism and the philosophy of lao-tze and chung-tze. The formation of space were horizontally arrangement and vertical arrangement as the first-learning and then-ancestor shrine of Youngnam provinces. 2. Background and factors of site selection were applied geographical feature, tried to connect owner home town. 3. The shape of path of flow were simple of vertical and curved composition, were continued, were stabilized through composition of human scale's space by reasonable internal. A case of Sangju area, D/H ratio of the front area of buildings and courts was as follows. D/H=1>Hyangkyo> houses on the river>temples>lecture halls. D/H ratio ot the backside areas is as follows. D/H=1>Hyangkyo>houses on the river>lecture halls. 4. Inner garden were planted deciduous than evergreen trees with Lagerstroemia indica. Enclosed dominant trees were planted by Pinus densiflora, Querces seuata.construct GEM strain, and examined for the expression and functional stability in microcosms.

  • PDF

학습자를 위한 웹듀이의 사용성 증진 방안 연구 (A Study on Improving Usability of Webdewey for Learners)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제33권2호
    • /
    • pp.75-95
    • /
    • 2022
  • 본 연구는 분류 학습의 기본 도구가 된 웹듀이의 발전 및 기능 변화를 분석하고, 이를 학습자를 위한 사용성의 측면에서 분석하여, 웹듀이의 사용성 증진을 위한 구체적인 방안을 제안하는 목적을 가지고 수행되었다. 이러한 연구 목적을 달성하기 위하여 먼저 UI와 사용성의 개념과 원칙을 정리하고, 웹듀이의 구성 및 주요 기능을 분석하였다. 또한, 웹듀이의 매체 변화 및 시기별 기능 변화를 고찰하였다. 이후 웹듀이를 학습 과정에서 사용한 학습자들을 대상으로 웹듀이 사용성에 관한 의견 조사를 수행하고, 여기서 도출된 시사점과 개선 방향성을 바탕으로 웹듀이의 사용성 증진 방안을 제안하였다. 사용성 증진 방안은 UI의 측면과 합성 기능의 측면으로 나누어 제안되었다. UI의 측면에서는 디스플레이 방식, 시각화 장치, 인쇄본의 장점 도입, 한국어 버전 개발 등의 제안이 이루어졌다. 번호 자동 합성 기능의 측면에서는 기본 번호 선택, 합성 경로 안내 및 오류 메시지 제공, 참고 주기 및 경로 신설, 화면과 버튼 설계, 합성 내역 안내 등의 측면에서 사용성 증진 제안이 이루어졌다.

초등학교 안전교육 내용분석연구 (A Study on the Contents Analysis of Safety Education in Elementary School : Focusing on Comparison with the Needs of Students)

  • 김탁희;이명선
    • 보건교육건강증진학회지
    • /
    • 제18권2호
    • /
    • pp.45-63
    • /
    • 2001
  • The objective of this study is to give basic materials for selection and improvement of contents of safety education, which is substantially helpful to elementary students, by analysis of contents of safety education in some subjects and assessment of the needs of elementary students for safety education. For this purpose, this study was analyzed the contents of safety education in five subjects for elementary school and conducted the survey of 883 students in some elementary schools in Seoul from April 7 to 22, 2000. The results were as follows; 1. As a result of analysis of the proportion of contents regarding safety-related education in some subjects, Physical Education occupied the highest proportion (14.09%), and that was followed by Practical Subject (9.55%) and Moral Education (9.34%). However, the proportions in Social Study and Natural Science were very low, 1.85% and 1.31% each. In total lines of these five subjects, the numbers of line regarding safety education was contained by 5.78%. 2. Analyzing the proportion of domains of safety education in five textbooks, the Meaning of Safety and Basic Principles occupied the highest portion (29.5%), and that was followed by the Home Safety (24.0%), the Safety in School (17.1%), and the Play and Leisure Safety (14.0%). The Coping with Accidents and First Aid, the Safety from Fire and Explosion, and the Traffic Safety occupied relatively low portion, 6.9%, 5.7%, and 2.8% each. 3. As a result of analysis of the proportion of the safety education domain in each subject, the Meaning of Safety and Basic Principles occupied the highest portion (23.6%) in Moral Education, the Home Safety (12.7%) in Practical Subject, and the Play and Leisure Safety (10.9%) in Physical Education. 4. Most of the participants in this survey experienced the Home Accidents (71.1%). And also, they experienced the Play and Leisure Accidents (57.9%), the Accidents in School (49.7%), the Traffic Accidents (45.3%), and the Fire and Explosion Accidents (24.7%) in order. 5. In the average proportion of the needs of participants for safety education in each domain, the Coping with Accidents and First Aid has the highest point (4.05). And, that was followed by the Home safety (3.79), the Safety from Fire and Explosion (3.73), the Meaning of Safety and Basic Principles (3.65), the Play and Leisure Safety (3.50), the Safety in School (3.37), and the Traffic Safety (3.35). The average proportion of the needs for safety education of total domains was 3.66. 6. In the needs for safety education regarding the feature of participants, it showed higher scores in female students than male ones (p〈0.001), in lower grader than higher grader (p〈0.05), and in the students born to wealth than those born poor (p〈0.05). Also, the children who recognize the necessity of safety education showed higher scores of the needs for safety education (p〈0.001). And it also showed the same results of high score to the children whose parents did the safety education (p〈0.00l) and to the children and their parents who have the higher degree of practicing safety (p〈0.001), and these differences were statistically significant. 7. In the extent of preference for methods of safety education, it showed high score to the Field Learning, followed by the Audio- Visual Education, the Discussion, and the Instruction of teacher. In the extent of preference for subjects regarding the contents of safety education by each domain, it showed high score to the subject of Safety for 4 domains - the Meaning of Safety and Basic Principles, the Traffic Safety, the Safety from Fire and Explosion, and the Coping with Accidents and First Aid. And also, they preferred Moral Education for 2 domains - the Home safety and the Safety in School, and Physical Education for a domain of the Play and Leisure Safety. 8. While 27 of 36 detail items was contained the contents of safety education, the proportion of needs of participants for safety education showed more than average 3.00 score in 34 of 36 detail items. However, none of 9 detail items was included in five textbooks. Also, 2 detail items - the Coping with Disasters and the Safety from Poisoning - were included together 2 parts; One part had the higher ranked 7 items acquired by analysis of the needs, and the other had the higher ranked 7 items acquired by analysis of the contents. But, except those 2 items, none of items were matched with each part.

  • PDF

용어 가중치부여 기법을 이용한 로치오 분류기의 성능 향상에 관한 연구 (A Study on the Performance Improvement of Rocchio Classifier with Term Weighting Methods)

  • 김판준
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.211-233
    • /
    • 2008
  • 로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부석 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.