机器学习理论与实践:关联规则、推荐算法与神经网络
1. 关联规则挖掘与商品规则排序
关联规则挖掘可用于根据客户的购买历史生成产品推荐。对于商品规则排序,我们可以按支持度对杂货规则进行排序。以下是相关代码及结果:
inspect(sort(MarketBasketRules_Eclat, by ="support")[1:5])
结果如下表所示:
| 序号 | 商品组合 | 支持度 |
| ---- | ---- | ---- |
| 1 | {面包和蛋糕, 奶油} | 0.5079331 |
| 2 | {面包和蛋糕, 水果} | 0.5053249 |
| 3 | {面包和蛋糕, 蔬菜} | 0.4994566 |
| 4 | {水果, 蔬菜} | 0.4796783 |
| 5 | {烘焙用品, 面包和蛋糕} | 0.4762008 |
接下来,我们将规则存储为数据框:
groceryrules_df <-as(groceryrules, "data.frame")
str(groceryrules_df)
这里的结果显示有531个观测值和2个变量。
需要注意的是,结果是基于项集的支持度而非提升度展示的,因为Eclat算法仅挖掘频繁项集,不会输出提升度指标,而Apriori算法更适合用于计算提升度。不过,这些输出展示了支持度最高的前五项集,可进一步用于生成规则。