关联规则中APRIORI算法

APRIORI算法
频繁项集

APRIORI算法通过迭代来计算数据库中频繁项集,第i次迭代计算所有频繁i项集
支持度:DB中含有s%的事务包含候选集

id
1ACD
2BCE
3ABCE
4BE

第一次得到

项集计数支持度
A250%
C375%
D125%
B375%

若取支持度为50%,则剩ACB
第二次迭代
得到

项集计数支持度
AC250%
BC250%
BE375%
CE250%

注:第三次迭代时,得到

项集计数支持度
BCE250%

可以认为第三次迭代结果中任一两项的结合在第二次迭代中
负边界:在候选集中由于支持度不够而被淘汰的候选集合,而不是在第i次迭代到第i+1次迭代中被淘汰的候选项集

从频繁项集得到关联规则

如果规则为{x1,x2,x3}->x4,那么项集{x1,x2,x3,x4}和{x1,x2,x3}都必须是频繁的,
规则置信度为c=s(x1,x2,x3,x4)/s(x1,x2,x3),置信度大于给定阈值的规则就是强关联规则
有必要系统地分析可以从频繁项集中得到所有关联规则
,并且选择那些置信度大于给定阈值的关联规则作为强关联规则
测得关联规则正确方法:A->B
s(A,B)-s(A) * s(B)>k k为适当常量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值