【数据挖掘】关联规则基础

本文介绍了关联规则分析的基础,包括Apriori和FP-Growth两种经典算法。关联规则用于发现数据集中不同项之间的关联关系,Apriori通过连接和剪枝生成频繁项集,而FP-Growth则通过构建FP树实现高效挖掘。此外,文章还阐述了关联规则的基本概念、最小支持度和最小置信度的区别,以及它们在挖掘过程中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关联规则基础


1.关联规则分析:

关联规则分析也称为购物篮分析,最早是为了发现超市销售数据库中不同的商品之间的关联关系。
关联规则分析目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。

2.常用算法:

Apriori:关联规则最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连接产生候选项及其支持度然后通过剪枝生成频繁项集。
FP-Tree:针对Apriori算法的固有的多次扫描事物数据集的缺陷,提出的不产生候选频繁项集的方法。Apriori和FP-Tree都是寻找频繁项集的算法。
Eclat算法:Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间划分为较小的子空间。
灰色关联法:分析和确定各因素之间的影响程度或是若干个子因素(子序列)对主因素(母序列)的贡献度而进行的一种分析方法。

3.关联规则的基本概念

事务和项集
关联规则的分析对象是事务。
事务可以理解为一种商业行为,含义极为广泛。
事务也即购物篮,在实际应用中有多种不同的理解。

4.关联规则和频繁项集

关联规则:形如X->Y形式的蕴含表达式,其中X和Y是不相交的。

5.最小支

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

镰刀韭菜

看在我不断努力的份上,支持我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值