• 제목/요약/키워드: NewsML

검색결과 12건 처리시간 0.033초

NewsML 기반의 뉴스 자동 분류 시스템에 관한 연구 (Study on Automatic Classification System of News based on NewsML)

  • 이탁희;홍금원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.619-622
    • /
    • 2008
  • 뉴스 분류 체계는 각각의 기사에 정치, 경제, 사회 등 가장 적합한 주제별로 분류하는 것으로 언론사별 분류 체계는 통일성이 없이 전혀 다르게 구성되어 사용하고 있다. 이로 인해 방대한 콘텐트를 통합하는데 많은 어려움이 있으며, 그만큼 시스템과 인력에 대해 중복 투자가 되고 있다. 이런 문제점을 개선하기 위해 국제 표준인 NewsML에 기반한 뉴스 분류에 대해 제안한다. NewsML은 XML 기반의 유연성과 확장성이 있는 구조적인 표준 형식으로 다양한 데이터 표현이 가능하여 자동 문서 범주화에 필요한 중요한 자질 선택이 가능하다. 본 논문에서는 NewsML 형식으로 되어 있는 뉴스와 그렇지 않은 뉴스를 구분하여 자동 분류에 대한 비교 실험을 한다. NewsML의 구조화된 정보를 활용한 실험이 뉴스의 제목과 본문만으로 실험한 결과보다 좋은 성능을 보여 주었으며, 그 중에서 자질 공간이 아주 큰 경우에 유용하고 문서 분류에 효과가 뛰어난 지지 벡터 기계 모델이 가장 좋은 성능을 보였다.

NewsML과 UCI를 적용한 뉴스 콘텐츠의 온라인 유통모델 (A New Online News Service Model, based on NewsML and UCI Systems)

  • 박창신;길덕
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2007년도 추계학술대회
    • /
    • pp.641-645
    • /
    • 2007
  • News contents, produced for paper readers, are more and more being used online instead of offline. Internet sites, expecially portals(naver, daum, nate etc.) are dominant marketplaces, where news are exchanged and values are added. So, establishing a new online news service system, which can satisfy news provider(copyright owner) and internet service provider together, is a necessary task under current online-dominant news service environment. UCI(Universal & Ubiquitous Content Identifier) and IPTC NewsML(News Mark-up Language) are considered as useful standards to compromise protection of news-copyright and enhancement of online use of news contents. This study is based on a real case of 'NewsBank' in korea, We expect that this study can show an inspiration to obtain two contradictory goals of copyright protection and free online use of copyright.

  • PDF

NewsML을 고려한 기술동향정보 메타데이터에 관한 연구 (A Study on Matadata of Technology Trends Informations Based on NewsML)

  • 이성숙;송인석
    • 한국문헌정보학회지
    • /
    • 제39권3호
    • /
    • pp.183-205
    • /
    • 2005
  • 기술동향정보는 연구개발 활동과 과학기술정책의 결정과정에서 매우 중요한 요소이다. 그러나 기술동향정보 메타데이터에 관한 연구는 미비한 실정이다. 이 연구는 뉴스분야에서 표준적 위치에 있는 NewsML을 참고하되, 국내 기술동향정보 서비스에서 사용된 요소를 고려하여 기술동향정보 메타데이터 요소와 스킴을 제안하였다. 이 연구 결과는 앞으로 국내의 실정에 맞는 기술동향정보 메타데이터 표준을 개발하기 위한 기초자료로 이용될 수 있을 것이다.

News/POI 정보의 tpegML 제작 및 구현 (tpegML Implementation for News / POI Information)

  • 임재윤;강용진;이은진;이권익;홍성욱;안충현;김순철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.235-238
    • /
    • 2006
  • 최근 ATSC, DVB, DMB 및 인터넷 등에서 경제적으로 고속 정보전송이 가능해 짐에 따라 교통정보 서비스 프로토콜인 TPEG이 XML형태로 개발되어 시험 서비스 되고 있다. 기존의 RTM, PTI 응용프로토콜에 대한 XML 버전을 참고하여, 현재 시험 서비스 중인 News, POI 응용 프로토콜에 대한 XML 버전을 제안한다. 교통정보제공자로부터 공급된 원 뉴스정보 및 위치기반 정보를 XML 파일로 인코딩하여 송신하고, 수신측에서 xsl 파일을 제작하여 수신된 XML 파일을 디코딩한 후, 교통정보를 출력하여 보임으로서 그 기능을 검증한다. 테이블 및 속성들에 대한 언어독립적인 ENTITY 와 DTD를 설계하여, 원 정보로부터 제작된 XML 파일에 대한 적합성을 검증할 수 있도록 하였고, 수신된 XML파일을 단말형태에 적합하게 표현하기 위해 xsl 파일을 제작하여 수신된 파일의 표현성 및 확장성이 용이하도록 설계하였다.

  • PDF

차세대 E-NIE 이러닝 시스템 설계 (Design of E-NIE Learning Systems based on NewsML)

  • 박선표;박명순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.268-271
    • /
    • 2010
  • 본 연구의 목적은 E-NIE 수업을 진행하는데 있어 기존 연구의 문제점과 개선점을 조사하고 수업자료선택, 수업진행, 발전방향에 관한 설문조사 결과를 토대로 멀티미디어 자료 검색 방법과 온라인에서 신문활용학습이 효율적으로 이루어질 수 있는 E-NIE 이러닝 시스템 발전 방안을 모색하기 위한 것이다. E-NIE에 뉴스 표준인 NewsML과 교육정보 표준인 KEM 그리고 학사관리운영플랫폼 LMS를 접목해 멀티미디어 자료와 교과 및 단원을 구조화해 표준화된 교육용 멀티미디어 아카이브를 구축하고 온라인으로 진단 형성 수행 평가, 토론학습, 협동학습 등이 가능하고 학생들의 성적과 진도는 물론 교수학습의 전반적인 과정을 통합적으로 운영 관리할 수 있는 E-NIE 이러닝 시스템을 제안한다.

랜덤 포레스트를 이용한 한국어 상호참조 해결 (Coreference Resolution for Korean Using Random Forests)

  • 정석원;최맹식;김학수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.535-540
    • /
    • 2016
  • 상호참조 해결은 문서 내에 존재하는 멘션들을 식별하고, 참조하는 멘션끼리 군집화하는 것으로 정보 추출, 사건 추적, 질의응답과 같은 자연어처리 응용에 필수적인 과정이다. 최근에는 기계학습에 기반한 다양한 상호참조 해결 모델들이 제안되었으며, 잘 알려진 것처럼 이런 기계학습 기반 모델들은 상호참조 멘션 태그들이 수동으로 부착된 대량의 학습 데이터를 필요로 한다. 그러나 한국어에서는 기계학습 모델들을 학습할 가용한 공개 데이터가 존재하지 않는다. 그러므로 본 논문에서는 다른 기계학습 모델보다 적은 학습 데이터를 필요로 하는 효율적인 상호참조 해결 모델을 제안한다. 제안 모델은 시브-가이드 자질 기반의 랜덤 포레스트를 사용하여 상호참조하는 멘션들을 구분한다. 야구 뉴스 기사를 이용한 실험에서 제안 모델은 다른 기계학습 모델보다 높은 0.6678의 CoNLL F1-점수를 보였다.

사용자 프로파일 및 어노테이션을 이용한 XML 문서 트랜스코딩 (XML Document Transcoding using User Profile and Annotation)

  • 정쌍용;손원성;이진상;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.469-471
    • /
    • 2003
  • 트랜스코딩이란 기존 유선 환경에서 제공되는 웹 컨텐츠를 특정 환경에 적합한 형태로 변환 하는 것을 의미한다. 그러나 이와 관련된 기존 연구에서는 사용자가 요구하는 사항만을 변환 하거나 서비스 제공자가 일방적으로 변환하여 웹 컨텐츠를 제공하고 있다. 따라서 이슈변화에 따른 사용자의 대처능력이 떨어지기 때문에 사용자의 사용성이 저하되며, 사용자에게 무의미한 정보 제공의 가능성이 있다. 이러한 문제점들을 해결하기 위해 본 논문에서는 사용자 프로파일에 의한 요구사항과 서비스 제공자의 의견을 함께 제공 할 수 있는 변환 기법을 제안 하고, 특히 멀티미디어 뉴스 제작을 위한 표준인 NewsML을 대상으로 적용하였다. 사용자 프로파일에 의한 요구 사항은 XML 문서의 구조정보를 이용하여 자동으로 추출하고, 서비스 제공자의 의견은 문서의 레이아웃(Layout) 정보를 가지고, 어노테이션(Annotation) 기법을 활용하여 수동으로 추출한다. 그 결과, 사용자 관점에 부합하는 변환이 이루어지고, 다양한 이슈변화에 대한 대처능력이 향상되어 사용자의 사용성이 증대 되었다

  • PDF

동적 프로파일과 어노테이션을 이용한 XML 문서 트랜스코딩 (XML Document Transcoding using Dynamic Profile and Annotation)

  • 정쌍용;손원성;이진상;임순범;최윤철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.1023-1026
    • /
    • 2003
  • 현재 유선에서 지원되는 웹 컨텐츠를 개인용 단말기에서 지원하기에는 단말기의 성능상 한계(screen size, memory size, bandwidth 등) 때문에 여러 가지 문제가 있다. 트랜스코딩이란 이러한 기존 유선 환경에서 제공되는 웹 컨텐츠를 특정 환경에 적합한 형태로 변환 하는 것을 의미한다. 그러나 이와 관련된 기존 연구에서는 사용자가 요구하는 사항만을 변환 하거나 서비스 제공자가 일방적으로 변환하여 웹 컨텐츠를 제공하고 있어 이슈변화에 따른 사용자의 대처능력이 떨어지고 사용자의 사용성이 저하되며, 사용자에게 무의미한 정보 제공의 가능성이 있다. 이러한 문제점들을 해결하기 위해 본 논문에서는 멀티미디어 뉴스 제작을 위한 표준인 NewsML을 대상으로 사용자의 동적 프로파일과 서비스제공자의 어노테이션을 이용하여 사용자가 요구하는 기사와 서비스 제공자가 제공하는 기사를 같이 변환하는 기법을 제안한다. 본 논문의 결과 갑자기 발생하는 사회적 이슈변화에 따른 사용자의 대처능력이 향상 되고 사용자가 불필요한 정보에 과다하게 노출되는 것을 막을 수 있다.

  • PDF

시맨틱 어노테이션을 이용한 XML 문서 트랜스코딩 (XML Documents Transcoding using Semantic Annotation)

  • 이진상;송특섭;손원성;고승규;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.523-525
    • /
    • 2004
  • 기존의 웹 컨텐츠를 휴대폰이나 poA등과 같은 개인용 단말기에 표현하기에는 단말기 성능상의 제약(낮은 CPU 성능, 작은 출력 화면, 입출력 방법의 단순함 등)이 따르게 되므로 컨텐츠 변환의 과정이 필요하게 된다. 트랜스코딩이감 기존의 웹 컨텐츠를 단말기의 환경에 따라 적합한 형태로 변환하는 것을 의미하며, HTML 문서의 레이아웃 정보를 이용하여 변환하는 연구가 다양하게 이루어져 왔다. 본 논문에서는 사용자 의견을 반영한 XML문서의 정확한 트랜스 코딩을 위하여 시맨틱 어노테이션 기법을 제안한다. XML 문서의 트랜스코딩에는 IPTC(International Press Telecommunications Council)에서 정한 NewsML을 기반으로 하였으며, 본 논문에서 제안하는 트랜스코딩 프레임워크는 크게 3단계로 나뉘어 진다. 어노테이션 생성 및 인식, 어노테이션의 구조 정보를 활용한 페이지 생성 및 페이지 앱 구성, 디바이스에 따른 페이지의 변환으로 구성된다. 향후 연구로는 어노테이션과 페이지 생성 기법을 통해 생성된 XML 문서를 CC/PP를 이용하여 poA나 휴대폰 등의 시스템에 적합하게 변환하는 기법 등이 요구된다.

  • PDF