• 제목/요약/키워드: 웹마이닝

검색결과 325건 처리시간 0.034초

인터넷 프로모션의 지식 인프라

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 12호통권79호
    • /
    • pp.28-29
    • /
    • 1999
  • 데이터 마이닝을 통해 기업은 웹사이트상의 패턴을 의미 있는 정보로 종합해내고 인터넷 상의 고객들과 예상치를 이해하고 연관시킬수 있게 된다. 데이터와 웹이 제공하는 방대한 사업지식의 흐름에 근거한 웹 마이닝은 온라인 고객과의 관계를 생성하고 유지시키며 생산성 있는 온라인 상점의 최전선을 구축하는데 있어 결정적 열쇠가 되는 것이다.

  • PDF

대용량 웹 로그 마이닝 및 공격탐지를 위한 B-트리 인덱스 벡터 기반 고속 검색 기법 (High-Speed Search Mechanism based on B-Tree Index Vector for Huge Web Log Mining and Web Attack Detection)

  • 이형우;김태수
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1601-1614
    • /
    • 2008
  • 최근 대부분의 인터넷 환경이 쳅 기반 시스템으로 발전하면서 웹 서비스 사용자 수는 꾸준히 증가하고 있다. 따라서 일반 사용자가 대형 포털 사이트 웹 서버 접속시 생성되는 로그 정보를 분석하여 웹 서버에 대한 공격을 탐지하거나 웹 마이닝 기술과 접목하기 위해서는 대용량의 웹 로그 정보에 대한 효율적인 분석 기법이 필요하다. 기존 웹 로그 전처리 기법은 로그 문자열의 순차적인 탐색을 수행하므로 대용량의 웹 로그 고속화 처리에 적합하지 않다. 본 연구에서는 대용량 웹 로그 정보에 대해 B-트리 인덱싱 벡터 구조를 이용하여 필드별 분류 및 고속 검색 알고리즘을 개발하였다 이를 통해 효율적으로 대용량 로고로부터 효율적인 세션 분석 기능과 개선된 검색 성능을 제공할 수 있었으며 웹 서버에 대한 공격 탐지에도 활용할 수 있었다.

  • PDF

웹 데이터 마이닝과 지식경영 프레임웍을 통한 지식-기반 디자인 패러다임 구축 (The Knowledge-Based Design Paradigm through Web Data Mining and Knowledge Management Framework)

  • 양종열
    • 디자인학연구
    • /
    • 제15권4호
    • /
    • pp.159-168
    • /
    • 2002
  • 세계는 지식정보사회(knowledge information society)에 돌입하였다. 정보기술은 지식경영을 등장시킨 요인중의 하나이며 지식경영발전을 가속화시키는 원동력이라고 볼 수 있다. 그리고 최근 정보기술과 인터넷은 눈부신 발전을 해오고 있다. 따라서 본 연구는 급변하는 디지털 환경하의 방대한 인터넷 데이터에서 웹 데이터 마이닝을 통해 고객에 대한 숨겨진 지식을 창출하고, 그 지식을 지식경영프레임웍에 적용한 지식-기반디자인 패러다임을 구축하여 디지털 환경에서 실시간에 고객에 대한 유용한 지식을 창출하여 고객의 욕구를 충족시키는 디자인을 개발 할 수 있도록 하는데 목적이 있다. 연구의 목적을 달성하기 위해 먼저 이론적 고찰에서 지식경영프로세스와 웹 데이터 마이닝에 관련된 다양한 사전 연구들을 살펴보고 지식경영프로세스와 웹 데이터 마이닝을 결합하여 새로운 지식-기반 디자인 패러다임(본 연구에서는 웹 데이터 마이닝과 지식경영프로세스가 통합하여 구현된 진정한 의미의 eCRM을 지식-기반 디자인패러다임이라 칭한다)을 제안한다.

  • PDF

웹 캐스트와 텍스트 마이닝을 이용한 축구 경기의 심층 분석 (In-depth Analysis of Soccer Game via Webcast and Text Mining)

  • 정호석;이종욱;유재학;이한성;박대희
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.59-68
    • /
    • 2011
  • 축구 경기를 분석하고 이를 팀 전략 수립에 활용하는 축구 분석관의 역할이 강조됨에 따라, 방송용 축구 경기에서 주요 이벤트의 탐지와 같은 절차적 기능 이상의 고수준의 해석 방법들이 요구되고 있다. 본 논문에서는 인터넷 기반의 텍스트 방송인 축구 웹 캐스트에서 실시간으로 제공하는 텍스트 정보를 기반으로 텍스트 마이닝을 이용한 축구 경기의 전략 수립이 가능한 고수준의 해석 기법을 제안한다. 제안하는 해석기법은 축구 웹 캐스트의 텍스트 정보와 도메인 지식을 기반으로 축구 경기의 다양한 속성, 동작 그리고 이벤트 등 메타데이터를 추출하고, 인덱싱하고, 텍스트 마이닝의 다양한 해석 기법인 연관 규칙 마이닝, 성장도 분석, 그리고 패스파인더 네트워크 분석 기법 등을 사용함으로써 유용한 지식을 추출한다. 실제 2010년 월드컵의 스페인 팀 경기들을 중계한 웹 캐스트의 텍스트 정보를 대상으로 제안된 기법의 타당성을 실험적으로 검증한다.

사례 유사도와 웹 마이닝을 이용한 XML 기반 경매 시스템의 설계 (Design of an XML-Based Auction System Using Case Similarity and Web Mining)

  • 조항철;이용규
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.348-354
    • /
    • 2001
  • 웹 상에서 인터넷을 이용한 전자상거래와 관련된 다양한 서비스가 창출되고 있다. 온라인 쇼핑몰에서 발전된 개념인 온라인 경매시스템은 쇼핑몰과는 달리 물품등록, 입찰 및 낙찰, 물품거래의 과정을 거친다 그러나, 대부분의 경매시스템은 입찰 및 낙찰과정에서 거래 당사자간에 신뢰성 있는 가격을 결정짓지 못하고 있다. 따라서, 본 논문에서는 가격 결정 방식에 따른 인터넷 경매의 종류와 유형을 분석한 후 경매 시스템 사용자들에게 사례 유사도와 웹 마이닝을 이용한 가격 정보를 제시하여 객관적인 기준으로 경매 물품의 가치를 평가할 수 있도록 하고, 표준화된 데이터 표현 방법인 XML을 이용한 인터넷 경매 시스템을 설계하고 프로토타입을 구현하고자 한다.

  • PDF

데이터마이닝을 이용한 웹 데이터 분석 (Analysis of Web Data Applying Data Mining)

  • 채승경;서용무
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.345-361
    • /
    • 2001
  • 인터넷의 확산으로 웹 구조, 웹 로그 등을 분석하는 웹마이닝(Web Mining)에 대한 연구가 활발히 진행되고 있다. 그러나 웹에서 발생하는 데이터에 대한 분석은 아직 미약한 상태이다. 웹에서 획득된 데이터는 신뢰도가 낮아 통계와 같은 기존의 분석 방법을 적용하기에 많은 어려움이 따른다. 또한 대용량 데이터와 실제 데이터에 유연한 분석을 제공하는 데이터 마이닝은 아직까지 적용 분야가 매우 한정되어 있다. 본 논문에서는 인터넷 사이트의 실제 데이터를 이용하여 데이터마이닝 과정에 따라 데이터 정제, 데이터 선택, 데이터 변환 등 효과적인 데이터 전처리 방법을 제시한다. 또한 이렇게 전처리된 데이터로 고객 세분화, 우수 고객 분류를 위한 데이터마이닝 기법을 적용한 후 수행 결과를 분석한다. 마지막으로 분석의 한계점을 지적하고 보다 양질의 데이터마이닝을 위한 시스템 및 사이트 설계 방안을 제시한다.

  • PDF

인터넷쇼핑몰에서 웹로그 분석에 대한 개선방안 연구 (A Study on the Improvement of Web-log Analysis in Internet Shopping-Mall)

  • 김남호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.134-139
    • /
    • 2002
  • 인터넷쇼핑몰 서버에의 고객의 상품에 대한 접근을 추적하여 고객의 성향을 추출하기 위한 웹마이닝에서는 웹서버가 생성하는 로그에서 필요한 정보를 수집하였다. 그러나 웹서버가 생성하는 로그는 단순 페이지 액세스의 정보만을 포함하고 있어, 현재 데이터베이스와 연동되어 동작하는 CGI 및 서버스크립트(JSP, ASP, PHP)등을 이용한 시스템에서는 CGI나 스크립트 파일명만 로그로 기록되고 분석시 가장 중요한 상품코드 및 상품 카테고리는 포함되지 않는다. 제안한 모델에서는 기존 쇼핑몰 시스템과의 연동 및 성능을 고려하여 웹서버에 분석전용 가상로그를 기존의 로그파일에 발생시키는 방법을 제안하였다. 이 방법으로 기존 사이트에 복잡한 코드를 추가할 필요 없이 간단한 로그발생코드 한 줄을 추가함으로써 해결할 수 있었다. 또한 유효 로그 필터링 및 클리닝에 걸리는 시간은 일반로그 분석대비 30%정도 향상되었으며 일반 로그에서는 불가능한 고객이 접근한 상품정보코드 및 카테고리코드 등의 정보를 쉽게 추출할 수 있었다.

  • PDF

웹 사용 정보에 기반한 다중 성향 키워드 모델의 설계와 응용 (Design and Application of Multi Concept Keyword Model based on Web-using Information)

  • 윤태복;이승훈;윤광호;이지형
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.95-105
    • /
    • 2009
  • 웹의 방대한 데이터에서 사용자에게 유용한 정보를 제공하기 위하여 다양한 연구가 시도되고 있다. 그 중에서 웹 사용 마이닝은 웹 사용자의 로그 정보를 기반으로 의미 있는 패턴을 추출하는 방법이다. 하지만 기존의 웹 사용 마이닝을 이용한 패턴 추출에는 사용자들의 다양한 성향을 고려하지 않은 개별적인 모델을 생성하는데 주를 이루고 있다. 웹에서 사용된 사용자들의 검색 키워드는 그들의 검색 의도나 배경지식에 따라 다양한 의미를 가질 수 있고, 그런 개개인의 검색의도에 맞는 검색 서비스가 제공할 수 있는 기술이 요구된다. 본 논문은 사용자 검색 키워드에 대한 웹 페이지 사용 행위 정보 및 방문한 웹 페이지 리스트를 수집하고 분석하여 다중 성향 키워드 모델(Multi Concept Keyword Model : MCK-Model)을 생성한다. MCK-Model은 사용자들이 특정 키워드를 이용하여 검색 후 방문한 웹 페이지 리스트를 통합하여 생성한 것으로, 사용자들이 검색 키워드에 대해 가지고 있는 다양한 검색 의도에 따라 방문하는 웹 페이지의 정보를 포함하고 있다. 생성된 MCK-Model은 웹 페이지 추천을 위하여 유용하게 사용할 수 있으며, 실험을 통하여 제안하는 방법의 유효함을 확인하였다.

  • PDF

전자상거래에서 FSM을 이용한 고객구매패턴 분석 (Analysis of Customer Purchase Patterns for Electronic Commerce Using FSM)

  • 주종문;황승국
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.53-67
    • /
    • 2003
  • 웹 마이닝은 전자상거래(Electronic Commerce)의 발전과 함께 그 중요성이 대두되고 있으며, 주로 전자상거래에서 구매자의 구매 경향을 분석하기 위해 중요한 주제로서 연구되고 있는 분야이다. 본 연구에서는 전자상거래에서 구매자의 구매과정을 퍼지환경으로 정의하고 기존의 웹 마이닝 방법론에 퍼지 이론을 도입한 새로운 방법론을 제안하였다.

  • PDF

웹 캐스트와 연관규칙 마이닝을 이용한 축구 경기의 심층 분석 (An In-depth Analysis on Soccer Game via Webcast and Association Rule Mining)

  • 정호석;이종욱;유재학;박대희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.17-20
    • /
    • 2011
  • 축구 비디오를 분석하고 이를 팀 전략 수립에 활용하는 축구 비디오 분석관의 역할이 강조됨에 따라, 축구 비디오에서 주요 이벤트의 탐지와 같은 절차적 기능에서 부터 고수준의 해석 방법에 이르는 다양한 기능들이 요구된다. 본 논문에서는 축구 웹 캐스트에서 실시간으로 제공하는 텍스트 정보를 기반으로 메타데이터 키워드 매칭을 통하여 축구 경기의 다양한 속성들을 추출하고 텍스트 마이닝의 대표적 해석 기법인 연관규칙 마이닝을 사용함으로써 축구 경기의 전략 수립이 가능한 고수준의 해석 방법을 소개한다. 실제 2010년 월드컵의 스페인 경기를 중계한 웹 캐스트의 텍스트 정보를 대상으로 제안된 방법론의 타당성을 검증한다.