关联规则R语言实战(Apriori算法)

本文介绍了关联规则的基本概念,包括支持度、置信度和提升度,并详细阐述了Apriori算法的原理。接着通过R语言的arules包,演示了从数据准备、建模到可视化的全过程,使用Epub数据进行实例操作,展示了如何挖掘和分析关联规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近遇到一个业务问题需要用关联规则的算法来实现,为了解决业务问题,我又重新复习了一遍以前就学过的Apriori算法并将其运用到业务场景中。下面,我想谈一谈在在具体的业务实现过程中我的一些感想。  

一.理论背景

1.1基本术语定义

  X和Y各代表某一个项集,M代表样本中的总项集数。

1.2关联规则的三个度量

  衡量关联规则有三个最基本也是最重要的指标,我将其称为‘三度’。这里的三度指的可不是《三傻大闹宝莱坞》里面那三个蠢萌蠢萌的印度人,而是指的度量关联规则最基础也是最核心的指标三兄弟:支持度,置信度,提升度。
  下面我将对这三兄弟进行逐一介绍。
  老大支持度,是‘三度’家族里最沉稳最老实的孩子。出于兄长对两个弟弟的谦让之情,关联规则家族建立的时候,老大主动表示他要来度量关联规则中最苦最累随时要给弟弟们提供理论支持的概念。关联规则家族表示老大good job,于是便给老大赐名为支持度,基本公式是

Support(X)=XM
说完了基本公式,我们来说说老大支持度的基本公式代表的基本概念:老大支持度表示了X项集出现的次数在所有项集的总次数中所占的比例。
  老二置信度,是‘三度’家族中最高调也是最不折手段的孩子。为了获得最重要的地位,老二踩着老大的肩膀往上爬,于是,他获得了赐名:置信度,基本公式是
Confidence(X>Y)=Su
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值