• 제목/요약/키워드: positive skewness

검색결과 44건 처리시간 0.03초

긍정/부정 비대칭도를 이용한 소수상품평의 검색 (Retrieving Minority Product Reviews Using Positive/Negative Skewness)

  • 조희련;이종석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권3호
    • /
    • pp.121-128
    • /
    • 2015
  • 소수 의견을 포함하는 온라인 상품평은 긍정 또는 부정 일변도인 상품평에서는 찾기 어려운 유익한 정보를 내포하기도 한다. 본 논문에서는 주어진 상품평 집합 속에서 소수상품평을 검색하는 방법을 제안한다. 제안방법은 개별 상품평을 먼저 긍정/부정 상품평으로 자동분류한 뒤, 주어진 상품평 집합의 긍정/부정 상품평의 비대칭도를 계산하여 소수상품평을 검색한다. 소수상품평 검색에서는 긍정/부정 자동분류 성능이 소수상품평 검색성능에 영향을 주는데, 본 논문에서는 도메인에 특화된 감성사전과 그렇지 않은 일반적인 감성사전을 가지고 상품평을 긍정/부정으로 감성분류한 뒤 비대칭도를 계산하여 소수상품평 검색성능을 비교한다. 스마트폰과 영화를 다룬 온라인 영문 상품평에 대하여 도메인에 특화된 감성사전을 가지고 소수상품평 검색성능을 평가한 결과, F1점수는 각각 24.6%와 15.9%였고, 정확도는 각각 56.8%와 46.8%였다. 이는 스마트폰과 영화의 개별 상품평 긍정/부정 분류 정확도가 각각 85.3%와 78.8%일 때의 성능이다. 본 논문에서는 또 긍정/부정 자동분류 성능이 주어졌을 때의 이론적인 소수상품평 검색성능에 대해서도 논의한다.

이변량 왜도, 첨도 그리고 표면그림 (Bivariate skewness, kurtosis and surface plot)

  • 홍종선;성재현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.959-970
    • /
    • 2017
  • 본 연구에서는 두 변수의 상관계수를 반영한 이변량 자료의 왜도와 첨도 통계량을 제안하고, 시각적으로 표현할 수 있는 표면그림을 개발한다. 이변량 왜도 통계량은 이변량 확률표본 자료의 치우침 방향과 정도를 표현하는 실수 한 쌍으로 정의한다. 첨도는 양의 값을 가지며 이변량 정규분포를 기준으로 꼬리 부분의 두터운 정도를 파악할 수 있다. 그리고 표면그림은 분위벡터를 바탕으로 평면에 구현한다. 다양한 형태의 이변량 자료를 생성하여 표면그림을 작성하고 왜도와 첨도를 계산하여 탐색해 본 결과, 왜도와 첨도 값들은 표면그림으로 구현한 이변량 자료의 특징을 잘 반영하는 것을 발견할였다. 그러므로 본 논문에서 제안한 왜도, 첨도 그리고 표면그림은 이변량 분포를 분석하는 기술통계학적 방법으로 활용할 수 있다.

Defect Diagnosis of Cable Insulating Materials by Partial Discharge Statistical Analysis

  • Shin, Jong-Yeol;Park, Hee-Doo;Lee, Jong-Yong;Hong, Jin-Woong
    • Transactions on Electrical and Electronic Materials
    • /
    • 제11권1호
    • /
    • pp.42-47
    • /
    • 2010
  • Polymer insulating materials such as cross linked polyethylene (XLPE) are employed in electric cables used for extra high voltage. These materials can degrade due to chemical, mechanical and electric stress, possibly caused by voids, the presence of extrinsic materials and protrusions. Therefore, this study measured discharge patterns, discharge phase angle, quantity and occurrence frequency as well as changes in XLPE under different temperatures and applied voltages. To quantitatively analyze the irregular partial discharge patterns measured, the discharge patterns were examined using a statistical program. A three layer sample was fabricated, wherein the upper and lower layers were composed of non-void XLPE, while the middle layer was composed of an air void and copper particles. After heating to room temperature and $50^{\circ}C$ and $80^{\circ}C$ in silicone oil, partial discharge characteristics were studied by increasing the voltage from the inception voltage to the breakdown voltage. Partial discharge statistical analysis showed that when the K-means clustering was carried out at 9 kV to determine the void discharge characteristics, the amount discharged at low temperatures was small but when the temperature was increased to $80^{\circ}C$, the discharge amount increased to be 5.7 times more than that at room temperature because electric charge injection became easier. An analysis of the kurtosis and the skewness confirmed that positive and negative polarity had counterclockwise and clockwise clustering distribution, respectively. When 5 kV was applied to copper particles, the K-means was conducted as the temperature changed from $50^{\circ}C$ to $80^{\circ}C$. The amount of charge at a positive polarity increased 20.3% and the amount of charge at a negative polarity increased 54.9%. The clustering distribution of a positive polarity and negative polarity showed a straight line in the kurtosis and skewness analyses.

Estimation of Predictive Value of a Positive Test from a Screening Test

  • Shin, Hyun Chul;Park, Sang Gue;Kim, Yong Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.567-574
    • /
    • 2003
  • The estimation problem of predictive value of a positive test(PVP), which is assessing the accuracy of a screening test is considered. Score methods discussed by Gart and Nam(1988) are proposed for constructing confidence interval for PVP. The simulation studies are conducted in evaluating the proposed methods and existing approximate ones.

Property Analyses of Deposits and Landform in Tidal Flat using Satellite Image

  • Jo, Myung-Hee;Sugimori, Yasuhiro;Jo, Wha-Ryong
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1998년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.110-115
    • /
    • 1998
  • Through the ISODATA method, the micro-landform of Julpo-Bay tidal flat was classified into mudflat, mixedflat, and sandflat using Landsat TM image. Each showed an apparent differences in its topographical characteristics and grain size composition. For example, mudflats are formed with flat faces and tidal channel of dissected gully. Its characteristics of grain size analysis that the grains have less than mean grain size 4 phi. Its sorting is bad (higher than 1 S.D.), and it showed strongly positive skewness. But sandflat is topographically flat without tidal channel. It has developed with ripple marks. According to the grain size analysis of deposits, the soil is coarse size with 90% of sand and its sorting is well(lower than 1 S.D.) Also, it showed strongly negative skewness. Mixed flat is in between mudflat and sandflat in its characteristics.

  • PDF

A Study on Exploring the Academic Dropout of College Students(Centering Around D College)

  • Lee, Jae-Do
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.89-92
    • /
    • 2008
  • This study analyzed the status and causes for the dropouts of college based on the survey conducted among 14,210 freshmen attending D College, other than the supernumerary special selection, from 2001 through 2005. A significant difference was shown in all items of general characteristics. The dropout rate of women, generally selected and general high school graduated were higher than for men, specially selected and special high school graduated, respectively. The most dropouts were due to Not Return(40.16%), followed by Unenrolled(32.98%), Voluntary Leave(26.05%) and Expelled(0.81%) in order. In the distribution of the central tendency values measured from the entire subjects. the high school records and the days of absence showed a positive skewness. while the college records showed a negative skewness with the data mostly around a higher grade. The standard deviation indicating that the dropouts got the scores higher than those of the continuing students demonstrated that there was relatively insignificant difference in scores between two groups.

  • PDF

근육 수축시 주관절 굴근의 활성화 유형에 대한 정량적 분석 (A Quantative Analysis of activation pattern of Elbow Flexor muscles during contraction)

  • 이두형;이영석;김성환
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 춘계학술대회
    • /
    • pp.6-9
    • /
    • 1996
  • In this paper, we attempted to analyze the contraction patterns of elbow flexor muscle during isometric, concentric and eccentric contraction. The analysis parameters are consisted of Sequency domain parameters (mean frequency, median frequency, skewness, kurtosis) and time domain parameters (zero crossing, positive maxima, integrated EMG). As a results, the analysis parameters have specific trends for muscles, muscle contraction patterns, muscle contraction angles. Especially, at the time domain analysis, IEMG is a dominant parameter for analysis of activation patterns, and the skewness, kurtosis are useful parameters for functional recognition.

  • PDF

수익률 분포의 적합과 리스크값 추정 (Distribution fitting for the rate of return and value at risk)

  • 홍종선;권태완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.219-229
    • /
    • 2010
  • 자산을 운용할 때 다양한 위험요인의 증가로 인해 위험관리에 대한 많은 연구가 진행되어왔으며, 통합적인 위험관리기법의 필요성이 대두됨에 따라 개발된 많은 방법 중의 하나가 리스크값이다. 현재까지 연구된 많은 리스크값의 추정과정에서 중요한 과제는 수익률분포의 비대칭성 및 두꺼운 꼬리와 같은 비정규성과 관련된 문제들을 해결하는 것이다. 대부분의 수익률 분포는 첨도가 매우 큰 양수값을 가지며 약한 음수값의 왜도를 갖는다. 본 연구에서는 실제 금융자산 수익률분포에 여러 종류의 대체분포들을 이용하여 실제의 수익률 분포에 적합한 분포를 선정하여 리스크값를 추정한다. 정규분포를 포함한 대체분포들을 이용하여 추정한 리스크값들이 실제 분포로부터 추정한 리스크값에 얼마나 일치하는지를 비교 연구한다. 다양한 대체분포 중에서 실제 분포에 정규혼합분포가 가장 적합하였으며, 이 정규혼합분포를 이용하여 추정한 리스크값과 다른 대체분포를 이용하여 구한 리스크값보다 정확함을 실증 자료를 통해 보였다.

국내 주식시장 변동성에 대한 국제유가의 영향: 이질적 자기회귀(HAR) 모형을 사용하여 (An Analysis of the Effects of WTI on Korean Stock Market Using HAR Model)

  • 김형건
    • 자원ㆍ환경경제연구
    • /
    • 제30권4호
    • /
    • pp.535-555
    • /
    • 2021
  • 본 연구는 국내 주식시장 변동성에 대한 국제유가의 영향을 실증적으로 분석한다. 분석을 위해 사용된 자료는 2015년 1월 2일부터 2021년 7월 30일까지 KOSPI 지수와 WTI 선물가격의 10분 주기 고빈도 자료이다. 이를 사용하기 위해서는 이질적 자기회귀(HAR) 모형을 사용하였다. 분석 모형에서는 고빈도 자료의 장점을 살려 국제유가의 영향을 수익률뿐 아니라 실현 변동성, 실현 왜도 및 첨도를 통해 확인한다. 추정에는 큰 왜도를 갖는 실현 변동성 분포를 감안하여 Box-Cox 변환을 적용하였다. 추정 결과, WTI 가격의 일간 수익률 변동은 KOSPI 수익률의 변동성에 통계적으로 유의한 양(+)의 영향을 미치는 것으로 나타났다. 하지만 WTI 수익률의 변동성, 왜도, 첨도는 KOSPI 수익률의 변동성에 영향을 주지 않는 것으로 나타났다. 이와 같은 결과는 KOSPI 수익률의 변동성이 거래 시간의 시차를 갖는 WTI 수익률의 일간 변화는 반영하지만 투자자의 일중 거래 행태까지는 반영하지 않기 때문으로 판단된다.