DOI QR코드

DOI QR Code

주변 조건부 변수에 의한 연관성 규칙 생성에 관한 연구

A study on association rule creation by marginally conditional variables

  • Cho, Kwang-Hyun (Department of Early Childhood Education, Changwon National University) ;
  • Park, Hee-Chang (Department of Statistics, Changwon National University)
  • 투고 : 2011.12.06
  • 심사 : 2012.01.05
  • 발행 : 2012.01.31

초록

연관성규칙은 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내는 기법이다. 현재 연관성규칙의 효율성을 개선하기 위하여 많은 연구자들에 의하여 제약 기반 연관성규칙의 연구가 활발하게 진행되고 있다. 연관성규칙 생성 시, 종종 많은 규칙들을 발견할 수 있다. 이들 규칙 중에서 변수들 간에 우연히 관련성이 높게 나타나는 경우가 존재할 수 있고 주변 조건부 변수 (매개변수, 외적변수)에 의하여 직접적인 관련성이 없는 규칙을 발견할 수도 있으며, 그 규칙은 간접적 해석만 가능하므로 의미가 없는 것으로 판단 할 수 있다. 이에 본 연구에서는 연관성 규칙에서 주변 조건부 변수를 고려한 연관성 규칙 생성에 관하여 연구하고자 하며, 이를 실례를 통하여 고찰하였다. 본 연구의 결과를 적용함으로써 연관성 규칙에서 의미 없는 규칙을 찾을 수 있으며, 변수들 간의 관련성을 보다 정확하고 명확하게 이해할 수 있을 것이다.

Association rule mining searches for interesting relationships among items in a given database. Currently, study of the constraint-based association rules are underway by many researchers. When we create relation rule, we can often find a lot of rules. Of this rules, we can find rule that direct relativity by marginally conditional variables (intervening variable, external variable) does not exist. In such a case, this association rule can be considered insignificant. In this study, we want to study for association rules creation using marginally conditional variable. The result of this study can find meaningless association rules. Also, we can understand more exactly the relationships between variables.

키워드

참고문헌

  1. 권구영 (2007). <사회복지조사방법>, 한국사회조사연구소, 서울.
  2. Agrawal, R., Imielinski, R. and Swami, A. (1993). Mining association rules between sets of items in large databases. Proceedings of the ACM SIGMOD Conference on Management of Data, 207-216.
  3. Agrawal, R. and Srikant, R. (1994). Fast algorithms for mining association rules. Proceedings of the 20th VLDB Conference, 487-499.
  4. Cho, K. H. and Park, H. C. (2011a). Discovery of insignificant association rule s using external variable. Journal of the Korean Data Analysis Society, 13, 1343-1352.
  5. Cho, K. H. and Park, H. C. (2011b). A study on insignificant rules discovery in association rule mining. Journal of the Korean Data & Information Science Society, 22, 81-88.
  6. Park, H. C. (2010a). Decision process for right association rule generation. Journal of the Korean Data & Information Science Society, 21, 263-270.
  7. Park, H. C. (2010b). Association rule ranking function by decreased lift influence. Journal of the Korean Data & Information Science Society, 21, 397-405.
  8. Park, H. C. (2011). Association rule ranking function by decreased lift influence. Journal of the Korean Data & Information Science Society, 22, 179-188.
  9. Park, J. S., Chen, M. S. and Philip, S. Y. (1995). An effective hash-based algorithms for mining association rules. Proceedings of ACM SIGMOD Conference on Management of Data, 104-123.
  10. Saygin, Y., Vassilios, S. V. and Clifton, C. (2002). Using unknowns to prevent discovery of association rules. Proceedings of 2002 Conference on Research Issues in Data Engineering, 45-54.
  11. Sergey, B., Rajeev M., Jeffrey D.U. and Shalom T. (1997). Dynamic itemset counting and implication rules for market data. Proceedings of ACM SIGMOD Conference on Management of Data, 255-264.

피인용 문헌

  1. A study on 3-step complex data mining in society indicator survey vol.23, pp.5, 2012, https://doi.org/10.7465/jkdi.2012.23.5.983