8、频繁模式挖掘算法综述

最新推荐文章于 2025-10-24 11:08:56 发布

深海孤鲸134

最新推荐文章于 2025-10-24 11:08:56 发布

阅读量7

点赞数

CC 4.0 BY-SA版权

分类专栏：挖掘数据背后的模式文章标签：频繁模式挖掘 MAFIA GenMax

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/grafana6viz/article/details/154889637

挖掘数据背后的模式专栏收录该内容

59 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

频繁模式挖掘算法综述

1. 投影与相关算法

在某些数据处理步骤中，会对特定位进行操作。例如，对第一阶位进行操作后，相同过程会在第二阶和第三阶位上重复两次。经过三次遍历后，每个桶会包含相应项集的支持计数，项集中的‘0’会被‘*’（表示“不关心”）替代。比如，在一个示例中，事务数量为 27，用桶 *** 表示；只有两个事务包含所有三个项，用桶 111 表示。

基于投影的方法相较于 MaxMiner 算法有显著改进。深度优先方法随后被应用于许多基于树的算法中。以下是一些相关算法的介绍：
|算法名称|特点|
| ---- | ---- |
|MAFIA 算法|与 Depth - Project 方法有相似之处，但使用基于位图的方法进行计数，而非投影事务数据库。当包含项集的事务比例较小时，可使用稀疏表示（如事务标识符列表）。该算法还提出了一些剪枝优化策略，当节点扩展的支持度与其父节点相同时，可修剪该子树。|
|GenMax|和 MAFIA 一样使用垂直表示来加速计数，具体使用 tidlists，并采用了 diffsets 概念和深度优先探索策略，还使用了连续聚焦方法来提高效率。|

2. 频繁闭项集挖掘算法

目前存在多种频繁闭项集挖掘算法，大多数最大和闭模式挖掘算法是基于非最大模式挖掘算法的不同变体，通常会在非最大模式挖掘算法中加入剪枝策略以提高效率。

2.1 Close 算法

该算法在闭项集搜索空间上应用基于 Apriori 的模式生成方法。闭项集格（搜索空间）的使用显著减少了算法的整体搜索空间。其操作是迭代进行的，每次迭代包含三个阶段：
1. 应用闭包函数获取候选闭项集及

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。