市场篮子分析中的交互式探索
1. 市场篮子分析概述
市场篮子分析是一种强大的数据分析方法,通过构建图来展示商品之间的关联。在这个图中,节点代表被购买的产品,当两种产品被一起购买时,它们之间就会形成边。一个广为人知的例子是“啤酒和尿布”的故事,虽然这个故事可能并不真实发生过,但它体现了市场篮子分析的核心思想,即找出商品之间的关联。这种关联在我们的日常生活中随处可见,比如在亚马逊上看到“购买了 X 商品的人也购买了 Y 商品”,在 Netflix 上看到“观看了 A 节目的人也观看了 B 节目”。
在实际应用中,我们使用一家五金店的匿名数据进行市场篮子分析,该数据包含超过 10,000 次购物篮购买中的 300,000 多件商品。构建的图大约有 8,000 个产品节点和 180,000 条边。市场篮子图往往非常密集,这意味着在聚合数千个购物篮的数据时,两个不相关的商品也可能会被一起购买几次。因此,为了探索图并获得有价值的见解,需要进行交互式操作。
2. 数据可视化与初始布局
在使用 Gephi 软件进行数据可视化时,初始视图可能看起来像一个节点随机分布的正方形。节点的大小和颜色根据该商品的总收益进行设置,粉色表示低收益,深紫色表示高收益;边的颜色则根据每对产品一起被购买的频率来确定。
由于图的规模较大,布局计算需要一定时间。例如,使用 Gephi 中的 Yifan Hu 多级布局进行布局计算大约需要 5 分钟。布局结果显示为一个不连通的图,包含一个非常大的组件、几个非常小的组件和许多孤立的点。这些孤立的点代表那些没有与其他产品一起购买的单个产品,比如一些专业工具或零件。
3. 导航操作
在图中进行
超级会员免费看
订阅专栏 解锁全文
43

被折叠的 条评论
为什么被折叠?



