Pre-Filtering based Post-Load Shedding Method for Improving Spatial Queries Accuracy in GeoSensor Environment

GeoSensor 환경에서 공간 질의 정확도 향상을 위한 선-필터링을 이용한 후-부하제한 기법

  • 김호 (인하대학교 컴퓨터정보공학과) ;
  • 백성하 (인하대학교 컴퓨터정보공학과) ;
  • 이동욱 (인하대학교 컴퓨터정보공학과) ;
  • 김경배 (서원대학교 컴퓨터교육과) ;
  • 배해영 (인하대학교 컴퓨터정보공학과)
  • Received : 2010.02.15
  • Accepted : 2010.03.19
  • Published : 2010.03.30

Abstract

In u-GIS environment, GeoSensor environment requires that dynamic data captured from various sensors and static information in terms of features in 2D or 3D are fused together. GeoSensors, the core of this environment, are distributed over a wide area sporadically, and are collected in any size constantly. As a result, storage space could be exceeded because of restricted memory in DSMS. To solve this kind of problems, a lot of related studies are being researched actively. There are typically 3 different methods - Random Load Shedding, Semantic Load Shedding, and Sampling. Random Load Shedding chooses and deletes data in random. Semantic Load Shedding prioritizes data, then deletes it first which has lower priority. Sampling uses statistical operation, computes sampling rate, and sheds load. However, they are not high accuracy because traditional ones do not consider spatial characteristics. In this paper 'Pre-Filtering based Post Load Shedding' are suggested to improve the accuracy of spatial query and to restrict load shedding in DSMS. This method, at first, limits unnecessarily increased loads in stream queue with 'Pre-Filtering'. And then, it processes 'Post-Load Shedding', considering data and spatial status to guarantee the accuracy of result. The suggested method effectively reduces the number of the performance of load shedding, and improves the accuracy of spatial query.

u-GIS환경에서 GeoSensor를 기반으로 하는 GeoSensor 환경은 다양한 센서들로부터 수집한 동적인 데이터와 기존 GIS인 정적인 지형지물 정보의 융합을 요구한다. 이 환경의 핵심인 GeoSensor는 넓은 지역에 산발적으로 분포하며, 다양한 크기의 데이터를 끊임없이 수집한다. 따라서 Data Stream Management System(DSMS)은 제한된 메모리로 인하여 저장 공간을 초과하는 문제가 발생한다. 이를 해결하기 위해 다양한 부하제한 기법들이 활발히 연구되고 있다. 부하제한 기법에는 크게 랜덤부하제한 기법과 의미적부하제한 기법, 샘플링 기법으로 분류된다. 랜덤부하제한 기법은 무작위로 데이터를 선택하여 삭제하고, 의미적부하제한 기법은 데이터의 우선순위를 부여하여 우선순위가 낮은 데이터부터 삭제한다. 샘플링 기법은 통계적인 연산을 이용하여 샘플링 비율을 산정하고 이를 토대로 부하를 제한한다. 그러나 기존 기법들은 공간적 특성을 전혀 고려하지 않기 때문에 공간 질의의 정확도를 감소시키는 문제를 갖는다. 본 논문은 GeoSensor 환경에서 DSMS에 발생하는 과부하 발생을 제한하고 공간 질의의 정확도를 향상시키기 위해 선-필터링을 이용한 후-부하제한 기법을 제안한다. 본 기법은 선-필터링을 통하여 스트림 큐에 불필요하게 가중되는 부하를 1차적으로 제한하며, 과부하 발생 시 공간 질의 결과 정확도를 보장하기 위하여 공간 중요도와 데이터 중요도를 고려하여 후-부하제한을 수행한다. 이 기법을 이용하여 부하제한 수행 횟수를 효과적으로 감소시켰고, 공간 질의의 정확도를 향상시켰다.

Keywords

References

  1. 이충호, 안경환, 이문수, 김주완, "u-GIS 공간정보 기술 동향," 전자통신동향분석, ETRI, 2007.
  2. 백성하, 이동욱, 김경배, 정원일, 배해영, "공간 슬라이딩 윈도우 집계질의의 정확도 향상을 위한 그리드해쉬 기반의 부하제한 기법," 한국공간정보시스템학회 논문지, 제11권 제2호, 2009, pp. 89-98.
  3. Ho K., Sung-Ha B., Dong-Wook L., Gyoung-Bae K., Hae-Young B., "Load Shedding applying range overlap ratio of spatial query over Data Stream," ASGIS2009, 2009, pp. 49-55.
  4. Brian B., Shivnath B., Mayur D., Rajeev M., and Jennifer W., "Models and Issues in Data Stream Systems," PODS, 2002.
  5. Viveca A., Anita H., and Peter R., "Dynamic Information in GIS Systems," Computers Environment and Urban Systems, Vol.19 No.2, 1995, pp. 107-115. https://doi.org/10.1016/0198-9715(95)00010-6
  6. Yi-Cheng T., Song L., Sunil P., and Bin Y., "Load Shedding in Stream Databases: A Control-Based Approach," In VLDB Conference, 2006, pp. 787-798.
  7. Nesume T., Ugur C., Stan Z., Mitch C., and Michael S., "Load Shedding in a Data Stream Manager," VLDB, 2003, pp. 309-320.
  8. Brian B., Mayur D., and Rajeev M., "Load Shedding for Aggregation Queries over Data Stream," ICDE, 2004, pp. 350-361.
  9. Sang Ki K., Sung-Ha B., Dong Wook L., Warn II C., Gyoung Bae K., Hae Young B., "Data Source Management using weight table in u-GIS DSMS," 한국공간정보시스템학회 논문지, 제11권 제2호, 2009, pp. 27-33.
  10. 정원일, 신숭선, 백성하, 이연, 이동욱, 김경배, 이충호, 김주완, 배해영, "u-GIS 컴퓨팅을 위한 GeoSensor 데이터 스트림 처리 시스템," 한국공간정보시스템학회 논문지, 제11권 제1호, 2009, pp. 9-16.
  11. Xin D., Alon H., "Indexing Dataspaces," SIGMOD, 2007.
  12. Kittisak K., Nittaya K., "Approximate Frequent Pattern Discovery over Data Stream," International Journal of Computer Science and Engineering, 2008, pp. 478-482.
  13. OpenGIS Implemenation Specification for Geographic information - Simple feature access - Part1: Common Architecture," www.opengeospatial.org, 2008.
  14. Chris O., Jing J., and Jennifer W., "Adaptive Filters for Continuous Queries over Distributed Data Streams," SIGMOD, 2003.
  15. "Tiger/Line Shapefiles.", www.census.gov/geo/www/tiger/tgrshp2007/tgrshp2007.html, 2007.