Apriori算法中使用Hash树进行支持度计数

Apriori算法中使用Hash树进行支持度计数

为什么使用Hash树来进行支持度计数

Hash树进行支持度计数的一个应用实例

建立一棵Hash树

对一个事务来说,其可能的子项集

使用Hash树进行支持度计数

为什么使用Hash树来进行支持度计数

在这里插入图片描述
在Apriori算法中,当查看一个候选集是否是频繁项集,需要将该候选集与DB中的每个事务进行比较,如果该候选集在这个事务中出现了,就将其支持度加1。当DB中有5个事务,而候选项集为3个的时候,其总的比较次数就是3×5=15次。
为了减少比较的次数,通过以Hash树的结构来存储候选集,每一个事务不再和每个候选集进行比较,而是和Hash树中特定的候选集进行比较。我们通过下面的一个例子来理解。

Hash树进行支持度计数的一个应用实例

假设我们已经有了候选三项集(共15个),候选集如下所示:在这里插入图片描述

建立一棵Hash树

针对这个候选集,我们

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值