关联规则挖掘Apriori

关联规则挖掘Apriori及FP-Growth算法

关联规则中的几个概念:
  1. 支持度:某个商品组合出现的次数与总次数之间的比例。支持度越高,代表这个组合出现的频率越大。

  2. 置信度:是个条件概念,即在A发生的情况下,B发生的概率是多少。

  3. 提升度:当A出现时,对B出现概率的提升程度。

    提升度(A→B)=置信度(A→B)/支持度(B)

    • 提升度(A→B)>1:代表有提升
    • 提升度(A→B)=1:代表有没有提升,也没有下降
    • 提升度(A→B)<1:代表有下降
Apriori工作原理:本质上是查找频繁项集的过程
  • 频繁项集指支持度大于等于最小支持度阈值的项集
Apriori算法流程:
  1. K=1,计算K项集的支持度;
  2. 筛选掉小于最小支持度的项集;
  3. 如果项集为空,则对应K-1项集的结果为最终结果。否则K=K+1,重复1-3步。
Apriori算法的缺点:
  • 由于采用排列组合的方式,因此可能会产生大量候选集
  • 每次计算都要重新扫描数据集来计算每个项集的支持度
  • 因此Apriori算法会浪费很多计算空间和计算时间
FP-Growth算法:Apriori算法的改进
  • 特点:创建一棵FP树来存储频繁项集,在创建前对不满足最小支持度的项进行删除,从而节省了存储空间
  • 整个生产过程只遍历数据集2次,大大
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Sweeney Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值