山东大学数据仓库数据挖掘知识点整理

关联规则
基于变量种类
布尔型关联规则
量化型关联规则
基于数据的抽象层次
单层的关联规则
多层的关联规则
基于规则中涉及到的数据的维数
单维关联规则
多维关联规则

关联规则挖掘分类
频繁项集挖掘
序列模式挖掘
结构模式挖掘

apriori算法
关联规则的挖掘过程分解为两个子问题

  1. 发现频繁项集
    支持度
  2. 由频繁项集生成关联规则
    置信度

apriori算法思想
是一种最有影响的挖掘布尔关联规则频繁项集的算法。它使用一种称作逐层搜索的迭代算法,通过k-项集用于探索(k+1)-项集。
Q:apriori算法得到的频繁项集是从频繁一项集开始还是只保留最大的?
在这里插入图片描述
在这里插入图片描述

fp树

  1. 每一item按照项出现次数用从大到小排列,删除非频繁项集的项
  2. 头表是链表的头结点,fffffff,bbbbbb这样的
    挖掘方法
  3. 遍历头表,得到项以及其对应的前缀、在该前缀下出现的次数
  4. 合并1得到的共同前缀,看是否能达到最小支持度
    优点:
    完整性,不会打破任何事务数据中的长模式
    紧凑性,减少不相关信息——非频繁项被删除;按频率递减排列——使得更频繁的项更容易在树结构中被共享。

apriori all

  1. 先得到频繁项集,各种长度的都要,跨元素的有序序列不算进来
    其实是得到频繁-1序列中的各个项集
  2. 将1得到的序列映射到几个整数,频繁二项集要拆成三个的那种
  3. 对映射完的序列再求频繁序列
  4. 最后删除各种子集,只留最大的

gsp
在这里插入图片描述

找的都是序列

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

决策树

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值