《Data Mining》学习——关联规则挖掘的模式评估方法

本文探讨了关联规则挖掘的基本概念及其局限性,并介绍了几种衡量关联规则相关性的指标,包括提升度、卡方检验、全置信度、最大置信度、Kulc度量及余弦度量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关联规则

大部分关联规则挖掘最终得出的是支持度与置信度。但是“强”关联规则不一定是正确的,这是因为这件事务的支持度可能大于与某项事物的置信度。

从关联分析到相关分析

我们对关联规则进行扩充得到,支持度,置信度,相关性称之为相关规则
相关性的表示

  1. 提升度:
    lift(A,B)=conf(A=>B)/sup(B)
  2. 卡方
    X2=
  3. 全置信度
    all_confA,B=min{P(A|B),P(B|A)}

  4. 最大置信度
    max_confA,B=max{P(A|B),P(B|A)}

  5. Kulc度量
    KulcA,B=max{P(A|B),P(B|A)}
  6. 余弦度量
    cosineA,B=P(A|B),P(B|A)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值