关联规则挖掘算法-FP-tree算法

FP-tree算法是数据挖掘中用于发现频繁模式的方法,包括构造FP-tree和挖掘频繁模式两步。首先,扫描数据库得到频繁1-项集并按支持度排序,再扫描构建FP-tree。例如,通过分析事务数据库,逐步加入事务形成FP-tree,并生成条件模式基。FP-tree算法减少了候选集的生成,但内存开销较大,适用于单维布尔关联规则挖掘。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

FP-tree两个主要步骤:
1. 利用事务数据库中的数据构造FP-tree;
2. 从FP-tree中挖掘频繁模式。

具体过程:
1.扫描数据库一次,得到频繁1-项集。
2.把项按支持度递减排序。
3.再一次扫描数据库,建立FP-tree。

为了方便大家理解,下面附上一个简单的例子。

给出一个具体的事务数据库:

利用出现的次数计算频繁1-项目集。

重新调整事务数据库:(在这里是对于每一个Items进行调整,把支持度高的放在前面)

创建根结点和频繁项目表:

加入第一个事务(I2,I1,I5ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值