数据挖掘学习笔记3: 关联规则1

本文介绍了关联规则挖掘的概念,以购物篮分析为例,详细讲解了Apriori算法的步骤和FP树结构的优势。Apriori算法通过连接和剪枝步骤寻找频繁项集,而FP树则通过避免生成候选频繁项集来提高效率。关联规则的挖掘旨在发现数据中的模式和关联性,如商品的捆绑销售。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

?关联规则挖掘

从数据的项集之间发现有趣的, 频繁出现的模式关联和相关性.
购物篮分析,分类设计, 捆绑销售和亏本销售

购物篮分析

-如果问题的全域是商店中所有商品的集合, 则对每种商品都可以用一个不二良来表示该商品是否被顾客购买, 则每个购物篮都可以用一个布尔量表示; 而通过分析不二向量则可以得到商品被频繁关联或被同事购买的模式, 这些模式可以用关联规则表示.(ex. 10010010000 这种方法损失了购买的数量但是不影响购物篮分析)

基本概念

这里写图片描述
- 关联规则的两个兴趣度度量
这里写图片描述
1. 支持度: 事务集中包含AB的百分比
这里写图片描述
这里的并集符号并不是指数学意义上的并集而是指Customerbuysboth
2. 置信度: D中包含A的事务同时也包含B的百分比
这里写图片描述

例子

TID item
2000 ABC
1000 AC
4000 AD
5000 BEF

假设最小支持度为50%, 最小置信度为50%则有

  • AC(50
  • CA(50

大型数据库关联规则过程

概念

这里写图片描述

关联规则分类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值