关联规则
基于变量种类
布尔型关联规则
量化型关联规则
基于数据的抽象层次
单层的关联规则
多层的关联规则
基于规则中涉及到的数据的维数
单维关联规则
多维关联规则
关联规则挖掘分类
频繁项集挖掘
序列模式挖掘
结构模式挖掘
apriori算法
关联规则的挖掘过程分解为两个子问题
- 发现频繁项集
支持度 - 由频繁项集生成关联规则
置信度
apriori算法思想
是一种最有影响的挖掘布尔关联规则频繁项集的算法。它使用一种称作逐层搜索的迭代算法,通过k-项集用于探索(k+1)-项集。
Q:apriori算法得到的频繁项集是从频繁一项集开始还是只保留最大的?


fp树
- 每一item按照项出现次数用从大到小排列,删除非频繁项集的项
- 头表是链表的头结点,fffffff,bbbbbb这样的
挖掘方法 - 遍历头表,得到项以及其对应的前缀、在该前缀下出现的次数
- 合并1得到的共同前缀,看是否能达到最小支持度
优点:
完整性,不会打破任何事务数据中的长模式
紧凑性,减少不相关信息——非频繁项被删除;按频率递减排列——使得更频繁的项更容易在树结构中被共享。
apriori all
- 先得到频繁项集,各种长度的都要,跨元素的有序序列不算进来
其实是得到频繁-1序列中的各个项集 - 将1得到的序列映射到几个整数,频繁二项集要拆成三个的那种
- 对映射完的序列再求频繁序列
- 最后删除各种子集,只留最大的
gsp

找的都是序列



决策树
两

最低0.47元/天 解锁文章
4590






