市场篮子分析:指标计算、数据处理与编码
1. 市场篮子分析指标
市场篮子分析中有几个重要的指标用于衡量商品之间的关联程度,以下是对这些指标的详细介绍:
- 置信度(Confidence) :置信度可以从条件概率的角度来理解,它表示在购买了商品 A 的情况下购买商品 B 的概率。通常表示为 $A \to B$,计算方法是筛选出包含商品 A 的交易,然后计算这些交易中同时包含商品 B 的比例。其取值范围是 $[0,1]$。例如,以啤酒和葡萄酒为例,若包含啤酒的交易有 3 笔(交易 2、6、7),且这 3 笔交易都包含葡萄酒,那么啤酒到葡萄酒的置信度就是 1,意味着每次顾客购买啤酒时也会购买葡萄酒。一般来说,置信度越高,商品之间的关联越有实际意义。
- 提升度(Lift)和杠杆率(Leverage) :提升度和杠杆率虽然计算方式不同,但目的都是回答同一个问题:能否根据一个商品的购买情况来推断另一个商品的购买情况。它们都表示为 $A \to B$。提升度计算的是两种情况下支持度的比值,取值范围是 $[0, +\infty)$。当提升度等于 1 时,两个商品相互独立,无法根据商品 A 的购买情况推断商品 B 的购买情况。杠杆率计算的是两种情况下支持度的差值,取值范围是 $[-1, 1]$。当杠杆率等于 0 时,与提升度等于 1 的含义相同。这两个指标的值衡量了商品之间关系的强度和方向,离独立点(提升度为 1,杠杆率为 0)越远,关联越强。例如,若提升度为 0.1,则表示两个商品之间存在较强的负向关联,即购买一个商品会降低购买另一个商品的概率。
- 确信度(Conviction) :确信度
超级会员免费看
订阅专栏 解锁全文
24

被折叠的 条评论
为什么被折叠?



