市场篮子分析:数据处理与指标计算全解析
市场篮子分析指标详解
市场篮子分析是一种用于发现商品之间关联关系的数据分析方法,其中有几个关键指标能帮助我们量化这些关系。
-
置信度(Confidence)
置信度可以从条件概率的角度来理解,它表示在购买了商品 A 的情况下购买商品 B 的概率。通常表示为 A → B,计算方法是先筛选出包含商品 A 的交易,再计算这些交易中同时包含商品 B 的比例。其取值范围是 [0, 1]。例如,以啤酒和葡萄酒为例,假设包含啤酒的交易有 3 笔(交易 2、6 和 7),且这 3 笔交易都包含葡萄酒,那么啤酒 → 葡萄酒的置信度就是 1,意味着每次顾客购买啤酒时也会购买葡萄酒。一般来说,置信度越高,关联关系越有价值。 -
提升度(Lift)和杠杆率(Leverage)
提升度和杠杆率虽然计算方式不同,但都用于回答同一个问题:能否根据一种商品的购买情况来推断另一种商品的购买情况?- 提升度 :计算的是两种情况下支持度的比率,取值范围是 [0, +∞)。当提升度等于 1 时,两种商品相互独立,无法根据商品 A 的购买情况推断商品 B 的购买情况。
- 杠杆率 :计算的是两种情况下支持度的差值,取值范围是 [-1, 1]。杠杆率等于 0 与提升度等于 1 的含义相同。
- 这两个指标的值衡量了商品之间关系的强度和方向。例如,提升度为 0.1 表示两种商品之间存在很强的负
超级会员免费看
订阅专栏 解锁全文
1276

被折叠的 条评论
为什么被折叠?



