3、频繁闭合序列模式挖掘方法解析

频繁闭合序列模式挖掘方法解析

1. 候选序列生成及GSP算法问题

在序列模式挖掘中,会根据特定规则生成候选序列。假设两个序列 s1 = s(x1 · · · xm−1xm) s2 = s(x1 · · · xm−1xm+1) ,其中 s s1 s2 的最大公共前缀,那么会生成一个长度为 (k + 1) 的候选序列 s(x1 · · · xm−1xmxm+1) 。另一种情况,若 s2 的最后一个元素包含一个项,且 s2 的倒数第二个元素与 s1 的最后一个元素除了按字母顺序在 s1 最后一个元素中排最后的那个项外都相同,例如 s1 = s(x1 · · · xm−1xm) s2 = s(x1 · · · xm−1)y ,则会生成候选序列 s1 = s(x1 · · · xm−1xm)y

生成长度为 (k + 1) 的候选序列后,会测试其每个长度为 k 的子序列是否也是长度为 k 的序列模式,只有通过测试的候选序列才会在下一轮与数据库进行匹配计数。

GSP算法虽然受益于Apriori剪枝,但仍会生成大量候选序列。例如,6个长度为1的序列模式会生成51个长度为2的候

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值