市场篮分析与数据聚类:挖掘数据中的潜在模式
1. 关联规则排序
在市场篮分析中,根据分析目标,最有用的关联规则可能是那些具有最高支持度、置信度或提升度的规则。借助 arules 包与 R 语言的 sort() 函数,我们可以对规则列表进行重新排序,使质量指标值最高或最低的规则排在前面。
要对 groceryrules 对象进行重新排序,可以使用 sort() 函数,并在 by 参数中指定 “support”、”confidence” 或 “lift”。结合向量运算符,我们能够获取特定数量的有趣规则。例如,使用以下命令可以查看根据提升度统计得出的前五个最佳规则:
> inspect(sort(groceryrules, by = "lift")[1:5])
输出结果如下:
|序号|左部 (lhs)|右部 (rhs)|支持度 (support)|置信度 (confidence)|覆盖率 (coverage)|提升度 (lift)|计数 (count)|
|----|----|----|----|----|----|----|----|
|[1]|{herbs}|{root vegetables}|0.007015760|0.4312500|0.01626843|3.956477|69|
|[2]|{berries}|{whipped/sour cream}|0.009049314|0.2721713|0
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



