复杂网络的解构与分析:产品网络与网络结构挖掘
1. 产品网络概述
产品网络是零售商品的网络,其中网络节点代表个人购买且同时出现在购物篮或购物车中的商品。若顾客经常或总是一起购买两种商品,就可以将这两个产品节点连接起来,这样的商品被称为互补品。例如,左右鞋(若分开销售)、螺母和螺栓、钉子和锤子,以及从波士顿到西雅图和从西雅图到波士顿的单程机票等。
产品网络可以是加权的,边的权重可以定义为共同购买的频率。之后,如果需要,可以对加权网络进行切片,去除低权重的边。此外,产品网络有时允许存在负权重的边。如果一对产品中的一个在某种意义上可以合理替代另一个,我们称它们为替代品。例如,住在阿拉斯加的人买了哈士奇来拉雪橇,就不太可能同时为了相同目的购买驯鹿(但仍可以把驯鹿当宠物),哈士奇和驯鹿就是替代品,可以用负权重的边连接相应节点来表示这种替代关系。
2. 探索食品配料网络
可以从自己的食品柜中寻找产品网络。当购买预制食品(如罐装烤豆)时,实际上购买了多种配料的组合,这些配料可以看作是单独的产品,它们同时出现在同一罐中,因此是成为产品网络节点的理想选择。通过构建产品网络,可以了解哪些配料组合最常见、配料如何分组以及哪些配料是食品的核心成分。
可以从美国农业部(USDA)的网站收集配料网络的数据。一开始,建议爬取几千页数据,例如 925 种产品和 356 种不同的配料。当两种配料同时出现在超过五种食品中时,就将它们的节点连接起来(选择五这个阈值是为了使网络保持连接但不过于复杂)。
以下是一些常见的配料节点:
| 配料名称 |
| — |
| 乙酰磺胺酸钾 |
| 切达干酪 |
| 果胶
超级会员免费看
订阅专栏 解锁全文
1192

被折叠的 条评论
为什么被折叠?



