• Title, Summary, Keyword: 수식 검색

Search Result 30, Processing Time 0.044 seconds

Performance Improvement of Mathematical Formula Retrieval Using Two Different Kinds of Embedding (두 종류의 임베딩을 이용한 수식 검색 성능 개선)

  • Yang, Seon;Kim, Hyemin;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • /
    • pp.616-618
    • /
    • 2018
  • 본 연구에서는 한글 질의어를 이용하여 MathML이라는 마크업 언어 형태로 저장된 수식을 검색하는 수식 검색 시스템을 제안하는데, 마크업 형태 자체에 대한 임베딩과 수식을 한글화 한 후의 임베딩이라는 두 가지 서로 다른 임베딩 결과를 이용하여 검색 성능을 향상시키는 것을 목표로 한다. 최근 자연어 처리의 많은 과제에서 임베딩은 거의 필수적으로 사용되고 있는데, 본 실험을 통해 자연어 문서가 아닌 마크업 형태 수식을 대상으로도 임베딩 사용이 성능 개선에 효과가 있음을 확인할 수 있다. 검색 환경을 실제와 유사하게 설정하기 위하여, 본 실험에서 사용하는 데이터에는 실험을 위해 수기로 작성된 수식들 외에도 실제 웹에서 가져온 여러 분야의 수많은 수식들이 포함된다. Indri 시스템을 이용하여 검색 실험을 수행한 결과, 임베딩을 활용하여 수식을 확장한 경우 수식 확장 이전에 비해 MRR 기준 4.8%p의 성능 향상을 확인할 수 있었다.

  • PDF

An Equation Retrieval System Based on Weighted Sum of Heterogenous Indexing Terms (이질적 색인어의 가중치 합에 기반한 수식 검색 시스템)

  • Shin, Jun-Soo;Kim, Hark-Soo
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.10
    • /
    • pp.745-750
    • /
    • 2010
  • To effectively retrieve mathematical documents including various equations, mathaware search engines are needed. In this paper, we propose a equation retrieval system which helps users effectively search structurally similar equations. The proposed system disassembles MathML equations into three types of heterogeneous indexing terms; operators, variables, and partial structures of equations. Then, it independently indexes the disassembled terms. When a user inputs a MathML equation, the proposed system searches and ranks equations using weighted sums of three language models for the heterogeneous indexing terms. In the experiments with 244,744 MathML equations, three proposed system showed reliable performances (a P@1 of 53% in the closed test and a P@1 of 63% in the open test).

Search Ranking System Using Modification Relation and Improved Search Engine Interface to Enhance Search Experience (수식 관계를 이용한 검색 결과 랭킹 시스템과 향상된 검색 엔진 인터페이스를 통한 검색 과정의 효율성 향상)

  • Moon, Ukseong;Choi, Joo-Won
    • Annual Conference on Human and Language Technology
    • /
    • /
    • pp.250-253
    • /
    • 2007
  • 본 논문에서는 현재 검색 엔진의 랭킹 방식의 문제점과 인터페이스의 문제점을 해결하기 위하여 노력하였다. 기존의 페이지간 링크와 같은 부가적 정보를 이용한 인기도 기반 랭킹의 문제점을 단어간의 수식 관계를 이용한 의미 기반 랭킹 알고리즘의 제시를 통해 해결하였다. 또한 검색어와 연관된 단어를 수식 관계를 이용하 계산, 시각화하여 제공함으로써 사용자가 잘못된 검색어로 검색을 시작하였더라도 항상 올바른 검색 결과를 얻을 수 있도록 도왔으며 각 검색 결과와 함께 원문을 요약해 제공함으로써 검색 결과를 일일이 클릭해 보지 않고도 내용을 쉽게 유추할 수 있도록 도왔다.

  • PDF

Keyword Extraction Using Modifying Relation to Improve Search Experience (수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상)

  • Moon, Uk-Seong;Lee, Sheen-Mok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

Query-Based Automatic Text Summarization Using MMR (MMR을 이용한 질의기반 자동 문서요약)

  • Kim, Gum-Young;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.615-618
    • /
    • 2002
  • 정보검색 엔진들은 주어진 질의에 대해 방대한 양의 문서들을 검색해주며, 이 문서들은 질의와의 관련성에 따라 랭킹(Ranting)된다. 질색된 문서들중에 어떤것들은 그 내용이 서로 유사하여 사용자에게 필요 이상의 정보를 제공한다. 이는 질의와의 관련성(Relevance)만을 적용하고, 검색된 정보들간의 차별성을 고려하지 않은데서 비롯된다. MMR(Maximal Marginal Relevance)은 유사한 문서를 검색결과에서 배제할 수 있게 해주는 기법이다. MMR을 자동에 적용하면, 유사한 문장을 배제하여 상이한 정보들을 전달하는 질 높은 요약문을 생성할 수 있다. 본 논문에서는 MMR을 이용한 질의기반 자동 문서요약 시스템을 구현한다. 또한, MMR과 가중치 수식에 다양한 수치를 적용하고, 최적의 결과를 산출하는 수식을 제안한다.

  • PDF

An Improvement of Mathematics Course Using MathML in ICT Environment (MathML을 이용한 수학교과 ICT활용 교육 개선방안)

  • Hong, Eun-Pyo;Lee, Su-Hyun
    • Journal of The Korean Association of Information Education
    • /
    • v.7 no.1
    • /
    • pp.11-26
    • /
    • 2003
  • Although many mathematical teaching/learning materials are already developed in the web, diverse utilization of this materials such as calculation, searching, or reusing of expressions are limited since the expression is actually a figure. To cope with this, MathML which describing mathematical notation was developed. In the paper, we proposed the methods of developing teaching materials using MathML, making learning assistance tools which utilize MathML, and applying MathML to information exchange community for Mathematics courses in ICT environment. Using MathML to develop a teaching material makes easy to correct and reuse the mathematical notations conveniently. Furthermore, learning assistance tools made by placing MathML help teachers reorganize and utilize these materials in the classroom as well as enhancing the connection between mathematical notations and concepts. The web-board that can make a use the mathematical notations using MathML enables the teachers and students to exchange information actively. It also helps to fulfill different types of teaching using ICT such as "discussion on the web".

  • PDF

Optimization Algorithm of Skip Factor using the Statistics of Scene Change (장면 전환 특성을 이용한 동영상 검색 감격의 최적화 알고리듬)

  • 하명환;나윤정;이상길
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • pp.147-155
    • /
    • 1998
  • 장면 전환 검출 알고리듬은 매 프레임마다 프레임간의 밝기차나 히스트그램 차이를 계산하므로 계산량이 많으며, 검출 속도 또한 느리게 된다. 검색 속도의 향상을 위해 시간적 표본화 방법이 제안되었으나, 적절한 검색 간격을 선택하는 어떠한 기준이나 방법도 제시되지 않았으며, 따라서 검색 간격을 경험에 의해 선택할 수밖에 없었다. 이 논문에서는 동영상의 통계적, 특성, 장면 전환 검색 간격과 장면 전환 검출 시간의 관계를 수식으로 유도하고 실험으로 확인하였다. 또한 최적의 표본화 간격을 유도된 식으로부터 구하고, 동영상의 평균 장면 전환 간격과 관계함을 보였다. 평균 장면 전환 간격이 알려져 있지 않은 동영상에 대해서 최적 검색 간격을 추정할 수 있는 알고리듬을 제안하였다.

  • PDF

A Study on Use of Search Data for Evaluation of Business Idea Attractiveness (사업 아이디어 매력도 평가를 위한 검색 데이터 활용에 관한 연구)

  • Shim, Jae-Hu;Choi, Myeong-Gil
    • Proceedings of the KAIS Fall Conference
    • /
    • /
    • pp.8-11
    • /
    • 2009
  • 성공적인 창업을 위해서는 창업가의 준비가 선행되어야 하지만, 매력적인 사업 아이디어의 계발이 뒤따라야 한다. 그러나 지금까지의 창업연구는 창업행동과 사업성과에 영향을 미치는 창업가 요인에 치우쳐 있으며, 사업 아이디어의 계발과 평가에 대한 연구는 부족한 실정이다. 이 연구는 고객이 상품을 구매하기 전 인터넷 검색엔진에서 해당 상품에 대한 검색을 하는 경우가 일반화되고 있다는 사실과 고객이 검색엔진에 입력하는 키워드는 고객의 의도를 대변한다는 사실을 기초로, 키워드로 표현된 사업 아이디어의 매력도를 객관적으로 측정하는 방법을 제시하는 것을 목적으로 한다.이 연구는 키워드로 표현된 사업 아이디어 매력도(BIA)를 구매의도를 가진 잠재고객의 자사 웹 사이트 방문수로 정의한다. 키워드로 표현된 사업 아이디어 매력도(BIA)는 [해당 키워드의 조회수(Q) ${\times}$ 구매의도 비율(R) / 경쟁 사이트의 수(S)]의 수식으로 나타낼 수 있으며, 수식을 구성하는 변수 중에서 해당 키워드의 조회수(Q)와 경쟁 사이트의 수(S)는 검색엔진에서 쉽게 제공 받을 수 있으므로, 구매의도 비율(R)만 알 수 있다면 BIA를 비교적 정확히 추정할 수 있다. 연구자는 특정 분야 키워드 100개를 선정한 다음, 전문가로 하여금 각 키워드의 구매의도 비율(R)을 추정하게 하고, 전문가 추정 없이도 구매의도 비율을 예측할 수 있도록 각 키워드의 구매의도 비율(R)을 예측하는 주요 데이터를 의사결정 나무 기법으로 도출하고, 의사결정 나무 기법으로 도출된 데이터로 구성된 회귀식을 제시함으로써 키워드로 표현된 사업 아이디어 매력도(BIA)를 객관적으로 평가하는 방법을 제시한다. 이 연구는 사업 아이디어의 계발과 평가에 대한 객관적인 기준을 제시함으로써 창업의 성공률을 높이는 데 기여할 수 있고, 창업연구에 새로운 방법론을 도입했다는 점에서 의의가있다.

  • PDF

An Efficient Range Search Technique in Road Networks (도로 네트워크에서 효율적인 범위 검색 기법)

  • Park, Chun Geol;Kim, Jeong Joon;Park, Ji Woong;Han, Ki Joon
    • Spatial Information Research
    • /
    • v.21 no.4
    • /
    • pp.7-14
    • /
    • 2013
  • Recently, R&D(Research and Development) is processing actively on range search in the road network environments. However, the existing representative range search techniques have shortcomings in that the greater the number of POI's, the more increased storage space or the more increased search time due to inefficient search process. Accordingly, In this paper, we proposed a range search technique using QRMP(QR-tree using Middle Point) to solve the problems of conventional range search techniques. In addition, we made a formula to obtain the total size of the storage space for QRMP and proved the excellence of the range search technique proposed in this paper through the experiment using actual road networks and POI data.

A Study on the Processing of SGML Documents based on DSSSL (DSSSL을 이용한 SGML 문서의 처리에 관한 연구)

  • 장은영;이경호;최윤철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • /
    • pp.401-406
    • /
    • 1998
  • 본 연구에서는 SGML 문서의 포맷팅과 변환을 지원하는 DSSSL 처리기를 개발하였다. 본 논문에서는 DSSL의 문서 처리 과정과 이를 지원하는 처리기의 개발 방법을 소개한다. 또한 개발 결과를 다양한 문서처리 환경에 적용하여 DSSL의 우수성과 개선이 요구되는 부분에 대하여 기술한다. 그 결과 DSSL은 구조 기반 검색을 지원하는 질의 언어와 다양한 연산기능을 지원하는 수식 언어에 기반하기 때문에 강력한 포맷팅과 변환기능을 제공한다. 그러나 처리 방식의 특성상, DSSL은 사용자 인터랙션이 많으며 위지윅한 문서 환경보다는 일괄처리 방식의 문서 처리 분야에 더 적합하다.

  • PDF