可扩展的重叠社区检测
在网络分析领域,检测重叠社区并预测节点间的新连接是一项重要任务。本文将介绍一种名为 TORTILLA 的贝叶斯概率网络模型,它能够有效地完成这些任务。
1. 预备知识
1.1 网络表示
网络可以表示为有向图 $G = {N_G, E_G}$,其中 $N_G = {1, \ldots, N}$ 是编号从 1 到 $N$ 的节点集合,$E_G \subseteq N_G \times N_G$ 是有向边的集合。节点代表网络中相互作用的实体,如个人、组织等。边表示节点之间的不对称交互,这些交互可以总结为一个 $N \times N$ 的二进制邻接矩阵 $L$。若 $u \to v$ 表示从节点 $u$ 到节点 $v$ 的交互,则邻接矩阵 $L$ 中元素 $L_{u \to v}$ 为 1 当且仅当 $\langle u, v \rangle \in E_G$,否则为 0。
1.2 潜在网络特征
每个网络 $G$ 都有两个内在特征:潜在结构 $C$ 和潜在行为角色集合 $R$。潜在结构 $C = {C_1, \ldots, C_K}$ 反映了节点被组织成 $K$ 个未观察到的社区。在每个社区内,节点的连接模式可以归因于抽象的行为类,这些行为类被形式化为 $H$ 个潜在角色的集合 $R = {R_1, \ldots, R_H}$。
为了准确捕捉节点与社区和角色的关联,我们区分了两种类型的关联:发送者关联和接收者关联。当节点 $u$ 连接到社区 $C_k$ 中的其他节点时,它作为发送者与 $C_k$ 关联;当 $u$ 被社区 $C_k$ 中的其他节点连接时,它作为接收者与 $C_k$ 关联。节点 $u$
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



