3、频繁闭合序列模式挖掘方法解析

脚滑的狐狸160

于 2025-11-04 10:16:48 发布

阅读量10

点赞数

CC 4.0 BY-SA版权

分类专栏：序列数据挖掘精要文章标签：序列模式挖掘 PreﬁxSpan GSP算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/nginx7reverse/article/details/154893485

序列数据挖掘精要专栏收录该内容

15 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

频繁闭合序列模式挖掘方法解析

1. 候选序列生成及GSP算法问题

在序列模式挖掘中，会根据特定规则生成候选序列。假设两个序列 s1 = s(x1 · · · xm−1xm) 和 s2 = s(x1 · · · xm−1xm+1) ，其中 s 是 s1 和 s2 的最大公共前缀，那么会生成一个长度为 (k + 1) 的候选序列 s(x1 · · · xm−1xmxm+1) 。另一种情况，若 s2 的最后一个元素包含一个项，且 s2 的倒数第二个元素与 s1 的最后一个元素除了按字母顺序在 s1 最后一个元素中排最后的那个项外都相同，例如 s1 = s(x1 · · · xm−1xm) 和 s2 = s(x1 · · · xm−1)y ，则会生成候选序列 s1 = s(x1 · · · xm−1xm)y 。

生成长度为 (k + 1) 的候选序列后，会测试其每个长度为 k 的子序列是否也是长度为 k 的序列模式，只有通过测试的候选序列才会在下一轮与数据库进行匹配计数。

GSP算法虽然受益于Apriori剪枝，但仍会生成大量候选序列。例如，6个长度为1的序列模式会生成51个长度为2的候

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。