FP-growth算法的理解

博客介绍了FP-growth算法,它用于发现繁集项,相比Apriori算法更快,只需扫描两次数据集。阐述了Apriori的支持度和置信度概念,指出FP-growth基于历史数据,不适用于新品推荐和数据流处理,介绍了其构建步骤和应用场景,还提到可能需手写代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

FP-growth是发现繁集项的一种算法,说到它大家都在把它与Apriori算法做比较,得出来的是FP-growth算法发现繁集项更快,

Apriori中有两个概念:

              1.  支持度: 某一事物占所有事物的比例

               2. 置信度:  类似条件概率,A ==> B 的置信度  支持度{A,B}/支持度{A}

FP-growth比Apriori更优一点,FP-growth只需要扫描两次数据集。

FP-growth算法是基于历史数据,不适应新品推荐,也不适合数据流处理。

FP-growth算法主要是2部分:

                   1.  扫描一次全表,构建表头项(去掉支持度为1, 2)

                   2.  扫描一次全表,构建FP树

FP-growth应用:  搜索繁集项,按最小支持度搜索或者抽取条件模式基。

FP-growth这部分代码没找到现成的,可能需要自己手写。

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值