机器学习:序列模式算法的原理、应用场景及优缺点介绍

一、序列模式算法概述

序列模式挖掘是数据挖掘的一个重要分支,主要用于发现数据集中的序列模式,即按照时间或其他顺序排列的事件模式。

二、AprioriAll算法(基于Apriori思想的序列模式挖掘算法)

  1. 原理

    • 频繁序列生成:类似于Apriori算法用于关联规则挖掘的思想。首先,找出所有长度为1的频繁序列(单项序列),通过扫描数据集,统计每个单项序列的出现次数,满足最小支持度阈值的即为频繁1 - 序列。然后,通过频繁k−1k - 1k1 - 序列来生成候选kkk - 序列。对于两个频繁k−1k - 1k1 - 序列,如果它们的前k−2k - 2k2个元素相同,并且最后一个元素不同,就可以将它们合并生成一个候选kkk - 序列。之后,再次扫描数据集来计算候选kkk - 序列的支持度,筛选出频繁kkk - 序列。这个过程不断迭代,直到不能生成新的频繁序列为止。
    • 支持度计算:序列的支持度定义为包含该序列的序列数量占总序列数量的比例。假设数据集DDD中有nnn个序列,序列sss出现的次数为mmm,则序列sss的支持度为:
      Support(s)=mnSupport(s)=\frac{m}{n}Support(s)=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

rubyw

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值