14、R语言市场篮分析与推荐引擎技术详解

R语言市场篮分析与推荐引擎技术详解

1. 市场篮分析基础

在R语言中,可使用 arules 包进行市场篮分析,该包提供了两种不同的规则查找方法,支持的算法有 apriori ECLAT ,其中 apriori 算法最为常用。

apriori 算法的原理是:如果一个项集是频繁的,那么它的所有子集也一定是频繁的。在执行算法前,分析师需确定一个最小频率(支持度),算法的执行步骤如下:
1. 令 k = 1 (项的数量)
2. 生成长度等于或大于指定支持度的项集
3. 迭代 k + (1…n) ,修剪那些不频繁(小于支持度)的项集
4. 当没有新的频繁项集被识别时,停止迭代

2. 业务理解

以杂货店为例,我们使用 arules 包中的 Groceries 数据集,该数据集包含了一家真实杂货店30天内的9835笔不同交易,所有购买的商品被分为169个类别,如面包、葡萄酒、肉类等。假设我们是一家初创的小型啤酒厂,希望了解潜在客户在购买啤酒时还会购买哪些其他商品。

3. 数据理解与准备

为了进行分析,我们需要加载两个包以及 Groceries 数据集:

library(arules)
library(arulesViz
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值