总述频繁模式、关联规则和相关规则的挖掘

本文探讨了在大量数据集中发现频繁模式、关联和相关关系的方法,并介绍了购物篮分析等应用实例。文中还概述了频繁项集的不同挖掘类型及其算法分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Ø         大量数据中的频繁模式、关联和相关关系的发现,在选中市场、决策分析和商务关联方面是有用的。一个流行的应用领域是购物篮分析,通过搜索经常一块(或依次)购买的商品的集合,研究顾客的购买习惯,以发现一些隐藏的、有趣的规则。典型的如顾客购买啤酒的时候很有可能会购买尿布。关联规则挖掘首先找出频繁项集(项的集合,如AB,满足最小支持度阀值,或任务相关元组的百分比),然后,由它们产生形如A=>B的强关联规则。这些规则也满足最小置信度阀值(预定义的、在满足A的条件下满足B的概率)。进一步分析关联,发现项集AB之间具有统计相关的相关规则。

Ø         根据不同的标准,频繁项集挖掘可以用很多不同的方法分成若干类型,如:

(1)       根据所挖掘的模式的完全性,频繁模式挖掘的类型包括挖掘频繁项集的完全集、闭频繁项集、极大频繁项集和被约束的频繁项集,等等。

(2)       根据规则涉及的层和维,类别可以包括单层关联规则、多层关联规则,单维关联规则和多维关联规则。

(3)       根据规则所处理的值类型,类别可以包括布尔关联规则和量化关联规则。

(4)       根据所挖掘的规则类型,包括关联规则和相关规则。

(5)       根据所挖掘的模式类型,可分为频繁项集挖掘,序列模式挖掘,结构模式挖掘,等等。

Ø         对于频繁模式的挖掘,已有许多有效的、可伸缩的算法,由它们可以导出关联和相关规则。这些算法可分为三类:

(1)       Apriori算法;

(2)       基于频繁模式增长的算法,如FP增长;

(3)       使用垂直数据格式的算法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值