非模块化区域网络中的模块发现
1. 引言
网络分析的常见方法是将网络划分为簇(或模块、社区),把相似或相互作用的节点分组在一起,这就是图聚类。这种分组有助于识别网络的底层结构并从中提取信息。例如,蛋白质 - 蛋白质相互作用(PPI)网络中的模块可能对应于蛋白质复合物。
然而,大多数网络聚类方法假定网络可以完全分解为模块,即每个节点都属于(通常恰好属于一个)模块。这种约束限制了可聚类的网络类型,也影响了从中获得的见解。比如在蛋白质相互作用网络中,强制这种约束可能导致在不存在模块的地方错误识别模块,而真正的模块则被噪声淹没。
为此,我们提出一种聚类模型,其中网络包含模块化区域和过渡区域。模块化区域由可划分为模块的节点组成,过渡区域包含位于模块之间或外部的节点。我们基于光谱特性提出两个分数,以确定网络与该模型的拟合程度。然后,我们在符合该模型的随机网络上评估三种(部分调整过的)聚类算法,通过分数和与真实情况的比较,找出不同算法表现良好的网络类型。
1.1 相关工作
近年来,一些方法对“完全划分”假设提出了挑战。例如,寻找重叠簇或进行模糊聚类的方法允许每个节点属于多个模块。而像 SCAN 和 Feng 等人描述的方法定义了三种类型的节点:属于单个模块的节点、可以属于多个模块的节点(枢纽)和不属于任何模块的节点(离群点)。不过,我们假设不属于模块的节点不一定是网络中小而可忽略的部分。
MSM(马尔可夫状态模型)算法是为解决在非完全可聚类(NCC)网络中识别模块的问题而提出的。它利用亚稳定性的概念,试图识别亚稳定集,并将其等同于模块。
1.2 我们的贡献
我们讨论具有过渡区域和模块的
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



