市场篮分析与K-means聚类:数据模式挖掘的双剑合璧
1. 市场篮分析中的关联规则
在市场篮分析里,关联规则是挖掘交易数据中潜在模式的有力工具。不过,并非所有规则都有实际价值。有些规则由于物品间的联系模糊不清,让人难以明白如何运用其中的信息,这类规则可能只是数据中的随机模式。例如,规则 {泡菜} → {巧克力冰淇淋} 可能仅仅是因为有一位顾客,其怀孕的妻子经常渴望奇怪的食物组合。
而最佳的规则就像隐藏的珍宝,一旦被发现,其中的模式就会显得显而易见。虽然理论上有足够时间的话,我们可以评估每一条规则来找出这些珍宝,但我们未必是判断规则是否可行、平凡或难以解释的最佳人选。所以,我们需要采用一些方法对规则进行排序和分享,让最有趣的结果浮出水面。
1.1 提升模型性能
主题专家或许能迅速识别出有用的规则,但让他们评估成百上千条规则会浪费他们的时间。因此,根据不同标准对规则进行排序,并将其从R环境中提取出来,以一种能与营销团队分享并深入研究的形式呈现,是很有必要的。这样能让结果更具可操作性,从而提升规则的性能。
1.2 关联规则排序
根据市场篮分析的目标,最有用的规则可能是那些具有最高支持度、置信度或提升度的规则。在R中, arules 包提供了 sort() 函数,可用于对规则列表进行重新排序,使质量指标值最高或最低的规则排在前面。
例如,要对 groceryrules 对象进行重新排序,可在调用 sort() 函数时,通过 by 参数指定 “support”、”con
超级会员免费看
订阅专栏 解锁全文
1187

被折叠的 条评论
为什么被折叠?



