重叠社区发现方法综述
1 引言
在网络分析中,发现重叠社区结构是一个重要的研究方向。许多现实世界的网络,如社交网络、蛋白质相互作用网络等,节点往往属于多个社区。本文将介绍几种常见的重叠社区发现方法,包括链接聚类、标签传播等方法。
2 链接聚类方法
2.1 线图的概念
链接聚类方法通过划分链接集而不是节点集来检测重叠社区,这里使用到了线图的概念。对于无向图 $G$,其线图 $L(G)$ 满足:
- 线图 $L(G)$ 的每个顶点代表图 $G$ 的一条边。
- 线图 $L(G)$ 中两个顶点相邻当且仅当它们对应的边在图 $G$ 中共享一个公共端点。
应用聚类到线图的主要优点是它能产生原始交互图的重叠图划分,允许节点存在于多个社区中。
2.2 基于线图的方法示例
- Pereira 等人的方法 :Pereira 等人首次使用线图为蛋白质 - 蛋白质相互作用网络寻找重叠模块,他们将一种已知的蛋白质相互作用网络方法(MCL)应用于线图。
- Evans 和 Lambiotte 的方法 :他们认为任何划分网络的算法都可应用于划分链接以发现重叠社区结构。他们首先回顾了一种使用图边动态过程统计特性的模块化定义,然后通过应用新的模块化概念提出链接划分。提出了三种用于划分网络 $G$ 链接的质量函数,每种函数形式化了不同的动态过程,并以不同方式探索原始图 $G$ 的结构。
- Link - Link 随机游走 :游走者以