R语言市场篮分析与推荐引擎技术详解
1. 市场篮分析基础
在R语言中,可使用 arules 包进行市场篮分析,该包提供了两种不同的规则查找方法,支持的算法有 apriori 和 ECLAT ,其中 apriori 算法最为常用。
apriori 算法的原理是:如果一个项集是频繁的,那么它的所有子集也一定是频繁的。在执行算法前,分析师需确定一个最小频率(支持度),算法的执行步骤如下:
1. 令 k = 1 (项的数量)
2. 生成长度等于或大于指定支持度的项集
3. 迭代 k + (1…n) ,修剪那些不频繁(小于支持度)的项集
4. 当没有新的频繁项集被识别时,停止迭代
2. 业务理解
以杂货店为例,我们使用 arules 包中的 Groceries 数据集,该数据集包含了一家真实杂货店30天内的9835笔不同交易,所有购买的商品被分为169个类别,如面包、葡萄酒、肉类等。假设我们是一家初创的小型啤酒厂,希望了解潜在客户在购买啤酒时还会购买哪些其他商品。
3. 数据理解与准备
为了进行分析,我们需要加载两个包以及 Groceries 数据集:
library(arules)
library(arulesViz
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



