关联规则FP-Growth算法

"本文详细介绍了FP-Growth算法的实施过程,包括如何构造FP-tree和寻找频繁项集。通过实例展示了数据预处理、F-list构建、FP-tree生成及频繁项集挖掘步骤。在设定的支持度50%和置信度70%条件下,最终确定了频繁项集{a,b}

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

FP-Growth

本文详细介绍FP-Growth构造FP-tree和找频繁项集(笔者研究方向确认为关联规则,作为初学者,若本笔记有错误,还望大家留言指出)

已知强关联规则如下表所示

TID Items
0 a,b
1 c,d
2 a,c,d,e
3 a,d,e
4 a,b,c
5 a,b,c,d

假设置信度为70%,支持度为50%

则最小支持度为:50%*6(6为集数个数)=3(表示Items中的元素满足≥3才为频繁项集)

FP-growth构造FP-tree时需要进行两次处理:

首先进行分类,求出F-list

我们先看表格,遍历一次数据集,统计每个元素出现的次数

a:5(出现5次)

b:3

c:4

d:4

e:2

然后把出现次数较小的滤掉(最小支持度3,将出现次数小于3的元素滤除)

再进行排序,将频率高的放于首位

F-l
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值