• 제목/요약/키워드: Dirichlet space

검색결과 66건 처리시간 0.025초

SVD-LDA: A Combined Model for Text Classification

  • Hai, Nguyen Cao Truong;Kim, Kyung-Im;Park, Hyuk-Ro
    • Journal of Information Processing Systems
    • /
    • 제5권1호
    • /
    • pp.5-10
    • /
    • 2009
  • Text data has always accounted for a major portion of the world's information. As the volume of information increases exponentially, the portion of text data also increases significantly. Text classification is therefore still an important area of research. LDA is an updated, probabilistic model which has been used in many applications in many other fields. As regards text data, LDA also has many applications, which has been applied various enhancements. However, it seems that no applications take care of the input for LDA. In this paper, we suggest a way to map the input space to a reduced space, which may avoid the unreliability, ambiguity and redundancy of individual terms as descriptors. The purpose of this paper is to show that LDA can be perfectly performed in a "clean and clear" space. Experiments are conducted on 20 News Groups data sets. The results show that the proposed method can boost the classification results when the appropriate choice of rank of the reduced space is determined.

공유경제 기반의 고객리뷰를 이용한 토픽모델링 분석: 공유주차를 중심으로 (A Study on Analysis of Topic Modeling using Customer Reviews based on Sharing Economy: Focusing on Sharing Parking)

  • 이태원
    • 한국산업정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.39-51
    • /
    • 2020
  • 본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA 분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를 위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.

윈드프로파일러의 평균모멘트 값을 이용한 도플러 파워 스펙트럼 및 시계열 원시신호 시뮬레이션기법 개발 (Development of Simulation Method of Doppler Power Spectrum and Raw Time Series Signal Using Average Moments of Radar Wind Profiler)

  • 이상윤;이규원
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1037-1044
    • /
    • 2020
  • 윈드프로파일러(RWP, radar wind profiler)는 기상 상태와 관계없이 시공간 분해능이 높은 바람장 자료를 제공하며 생산된 바람의 정확도나 품질에 대한 검증이 필수적이다. 기존 정확도 검증 방식은 레윈존데와의 동시 관측을 통해 윈드프로파일러에서 생성된 바람 벡터를 기준 자료로 활용하는 것이다. 본 연구에서는 평균 모멘트 자료로부터 스펙트럼과 원시 시계열 자료를 시뮬레이션하는 알고리즘을 통해 윈드프로파일러의 신호처리 알고리즘을 단계별로 검증하는 방안을 제시하고, LAP-3000의 원시 자료와의 비교를 통해 해당 알고리즘의 가능성을 확인하였다. 기상 신호의 밀도 함수를 모멘트값을 인자로 하는 왜곡된 정규 분포의 밀도 함수로 가정하여 생성하였고, 난수를 통해 시뮬레이션 스펙트럼을 생성하였다. 또한, 난수 위상과 역 이산푸리에 변환으로 간섭 평균된 시뮬레이션 원시 시계열 자료를 생성하고 최종적으로 디리클레 분포(Dirichlet distribution)를 통해 간섭 평균 전 단계의 원시 시계열 자료를 생성하였다.

스토킹 관련 언론기사에 대한 텍스트네트워크분석 (Text Network Analysis on Stalking-Related News Articles )

  • 지은선;정상희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.579-585
    • /
    • 2023
  • 본 연구의 목적은 텍스트네트워트분석을 통해 스토킹에 대한 정치성향의 언론기사 내에 핵심 단어를 탐색하고 내재된 의도를 살펴보는 것이다. 2018년 1월 1일부터 2022년 12월 31일까지 보도된 보수언론기사(조선일보, 중앙일보) 824건, 진보언론기사(한겨레신문, 경향신문) 783건으로 총 1,607건을 선정하여 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링 기법으로 도출된 주제범주의 양상을 탐색하였다. 연구결과는 보수언론과 진보언론의 공통된 토픽은 젠더폭력의 인식개선, 신변보호 및 처벌강도, 스토커 신상공개 도출되었고 두 언론의 상이한 토픽은 보수언론에서는 스토커의 가해행위, '신당역 살인사건'의 개요와 진보언론은 '신당역 살인사건'의 가중처벌요구, (사이버공간의) 성착취 범죄 근절로 구성되었다. 본 연구는 스토킹에 대한 언론기사 간의 이념적 의견에 따라 보도형태에 변화가 있음을 시사한다.

Empirical Comparison of Word Similarity Measures Based on Co-Occurrence, Context, and a Vector Space Model

  • Kadowaki, Natsuki;Kishida, Kazuaki
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.6-17
    • /
    • 2020
  • Word similarity is often measured to enhance system performance in the information retrieval field and other related areas. This paper reports on an experimental comparison of values for word similarity measures that were computed based on 50 intentionally selected words from a Reuters corpus. There were three targets, including (1) co-occurrence-based similarity measures (for which a co-occurrence frequency is counted as the number of documents or sentences), (2) context-based distributional similarity measures obtained from a latent Dirichlet allocation (LDA), nonnegative matrix factorization (NMF), and Word2Vec algorithm, and (3) similarity measures computed from the tf-idf weights of each word according to a vector space model (VSM). Here, a Pearson correlation coefficient for a pair of VSM-based similarity measures and co-occurrence-based similarity measures according to the number of documents was highest. Group-average agglomerative hierarchical clustering was also applied to similarity matrices computed by individual measures. An evaluation of the cluster sets according to an answer set revealed that VSM- and LDA-based similarity measures performed best.

EXISTENCE OF WEAK NON-NEGATIVE SOLUTIONS FOR A CLASS OF NONUNIFORMLY BOUNDARY VALUE PROBLEM

  • Hang, Trinh Thi Minh;Toan, Hoang Quoc
    • 대한수학회보
    • /
    • 제49권4호
    • /
    • pp.737-748
    • /
    • 2012
  • The goal of this paper is to study the existence of non-trivial non-negative weak solution for the nonlinear elliptic equation: $$-div(h(x){\nabla}u)=f(x,u)\;in\;{\Omega}$$ with Dirichlet boundary condition in a bounded domain ${\Omega}{\subset}\mathbb{R}^N$, $N{\geq}3$, where $h(x){\in}L^1_{loc}({\Omega})$, $f(x,s)$ has asymptotically linear behavior. The solutions will be obtained in a subspace of the space $H^1_0({\Omega})$ and the proofs rely essentially on a variation of the mountain pass theorem in [12].

장기억 과정에서 빠른 베이지안 변화점검출 (A Fast Bayesian Detection of Change Points Long-Memory Processes)

  • 김주원;조신섭;여인권
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.735-744
    • /
    • 2009
  • 이 논문에서는 장기억 과정에서의 변화점을 빨리 검출하는 베이지안 추론방법에 대해 알아본다. 장기억 과정에서의 베이지안 추정은 장기억 모수값에 따라 전체 자료에 대한 부분차분을 계산해야 하기 때문에 수행시간이 많이 걸린다는 문제가 있다. 이 논문에서는 이러한 문제를 해결하고자 장기억 모수공간을 그룹화하여 순서형으로 범주화시킨 후 설명력이 가장 높은 범주의 대표값을 선택하게 하였다. 이 방법은 초기단계에서 범주의 대표값에 대해 한번씩만 부분차분을 계산하면 되기 때문에, 매번 계산해야 하는 추정하는 방법보다, 특히 시계열자료의 수가 많은 경우, 상대적으로 빠른 베인지안 추론이 가능하다. 또한 장기억 모수공간이 (0,0.5) 이기 때문에 모수공간을 적절하게 그룹화한다면 장기억 모수를 선택하는 것이 모수를 추정하는 것에 비해 큰 차이가 없다. 이 논문에서는 나일강 수위자료 실증분석을 통해 제안된 방법의 타당성을 확인해본다.

QUANTUM MARKOVIAN SEMIGROUPS ON QUANTUM SPIN SYSTEMS: GLAUBER DYNAMICS

  • Choi, Veni;Ko, Chul-Ki;Park, Yong-Moon
    • 대한수학회지
    • /
    • 제45권4호
    • /
    • pp.1075-1087
    • /
    • 2008
  • We study a class of KMS-symmetric quantum Markovian semigroups on a quantum spin system ($\mathcal{A},{\tau},{\omega}$), where $\mathcal{A}$ is a quasi-local algebra, $\tau$ is a strongly continuous one parameter group of *-automorphisms of $\mathcal{A}$ and $\omega$ is a Gibbs state on $\mathcal{A}$. The semigroups can be considered as the extension of semi groups on the nontrivial abelian subalgebra. Let $\mathcal{H}$ be a Hilbert space corresponding to the GNS representation con structed from $\omega$. Using the general construction method of Dirichlet form developed in [8], we construct the symmetric Markovian semigroup $\{T_t\}{_t_\geq_0}$ on $\mathcal{H}$. The semigroup $\{T_t\}{_t_\geq_0}$ acts separately on two subspaces $\mathcal{H}_d$ and $\mathcal{H}_{od}$ of $\mathcal{H}$, where $\mathcal{H}_d$ is the diagonal subspace and $\mathcal{H}_{od}$ is the off-diagonal subspace, $\mathcal{H}=\mathcal{H}_d\;{\bigoplus}\;\mathcal{H}_{od}$. The restriction of the semigroup $\{T_t\}{_t_\geq_0}$ on $\mathcal{H}_d$ is Glauber dynamics, and for any ${\eta}{\in}\mathcal{H}_{od}$, $T_t{\eta}$, decays to zero exponentially fast as t approaches to the infinity.

스파이크 노즐 설계 (SHAPING A NOZZLE WITH A CENTRAL BODY)

  • 김철웅
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2005년도 추계 학술대회논문집
    • /
    • pp.293-298
    • /
    • 2005
  • We calculate the coordinates of an axisymmetric nozzle with a central body. This nozzle ensures a transonic flow with a plane sound surface, which is orthogonal to the symmetry axis and has a wall kink at the sonic point, The Chaplygin transformation in the subsonic part of the flow leads the Dirichlet problem for a system of nonlinear equations. The definition domain of the solution in the velocity-hodograph plane is taken as a rectangle. This enables one to obtain the nozzle with a monotonic distribution of velocity along its subsonic part. In the nonlinear differential equation, the linear Chaplygin operator for plane flows is separated, which allows the iterative calculation of the solution. The supersonic part of the nozzle is calculated under the assumption that the flow at the nozzle exit is uniform and parallel to the symmetry axis; i.e., the supersonic jet outflows to the submerged space with the same pressure. The calculation is performed by the characteristic method. The exact solution of Tricomi equation for near-sonic flows with the straight sonic line is used to 'move away' the sound plane. The velocity distribution alone the supersonic part of the nozzle is also monotonic, which ensures the absence of the boundary-layer separation and, therefore, the adequacy of the ideal-gas model. calculations show that the flow in the supersonic part of the nozzle is continuous (compression shocks are absent)

  • PDF

ON THE ANALOGS OF BERNOULLI AND EULER NUMBERS, RELATED IDENTITIES AND ZETA AND L-FUNCTIONS

  • Kim, Tae-Kyun;Rim, Seog-Hoon;Simsek, Yilmaz;Kim, Dae-Yeoul
    • 대한수학회지
    • /
    • 제45권2호
    • /
    • pp.435-453
    • /
    • 2008
  • In this paper, by using q-deformed bosonic p-adic integral, we give $\lambda$-Bernoulli numbers and polynomials, we prove Witt's type formula of $\lambda$-Bernoulli polynomials and Gauss multiplicative formula for $\lambda$-Bernoulli polynomials. By using derivative operator to the generating functions of $\lambda$-Bernoulli polynomials and generalized $\lambda$-Bernoulli numbers, we give Hurwitz type $\lambda$-zeta functions and Dirichlet's type $\lambda$-L-functions; which are interpolated $\lambda$-Bernoulli polynomials and generalized $\lambda$-Bernoulli numbers, respectively. We give generating function of $\lambda$-Bernoulli numbers with order r. By using Mellin transforms to their function, we prove relations between multiply zeta function and $\lambda$-Bernoulli polynomials and ordinary Bernoulli numbers of order r and $\lambda$-Bernoulli numbers, respectively. We also study on $\lambda$-Bernoulli numbers and polynomials in the space of locally constant. Moreover, we define $\lambda$-partial zeta function and interpolation function.