1. 支持度(Support)
支持度是两件商品(X∩Y)在总销售笔数(N)中出现的概率,即X与Y同时被购买的概率。
X、Y同时出现的概率
Support(X→Y) = P(XY)
2. 置信度 (Confidence)
置信度是购买X后再购买Y的条件概率。
Confidence(X→Y) = P(Y|X) = P(XY) / P(X)
3. 提升度(Lift)
提升度表示先购买其中一个商品对购买购买另一个商品的概率的提升作用,用来判断规则是否有实际价值,即使用规则后商品在购物车中出现的次数是否高于商品单独出现在购物车中的频率。如果大于1说明规则有效,小于1则无效。
Lift(X→Y) = Confidence(X→Y) / P(Y) = P(Y|X) / P(Y)
Lift(Y→X) = Confidence(Y→X) / P(Y) = P(X|Y) / P(X)
Lift(X→Y) = P(Y|X) / P(Y) = P(XY)/(P(X)*P(Y)) = P(X|Y)/P(X) = Lift(Y→X)
本文深入探讨了关联规则学习中的三个核心指标:支持度、置信度和提升度。支持度衡量商品组合的普遍性,置信度揭示了商品间的条件概率,而提升度则评估了规则的实际价值,帮助我们理解购买行为之间的潜在联系。
5万+

被折叠的 条评论
为什么被折叠?



