关联度和支持度

本文深入解析了关联规则中的两个关键概念:支持度和置信度。支持度衡量的是项集在数据集中出现的频率,而置信度则表示在出现某个项集的情况下,另一个项集出现的可能性。理解这两个概念对于挖掘有价值的数据模式至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

支持度和置信度总是伴随着关联规则存在的,它们是对关联规则的必要的补充。
对某条关联规则而言,如 A -> B (support=30%, confidence= 60%)
其中的support=30%是说,在所有的事务中同时出现A和B的概率。
而,confidence=60%是说,所有事务中,在出现A的情况下出现B的概率,即条件概率。

总体来说就是支持度A和B占总体样本的概率,置信度出现A情况下出现B的概率,条件概率,支持度反应A,B对总体样本的概率,置信度反应出现A样本中,B出现的概率
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值