复杂网络聚类与广义C均值聚类方法解析
在当今的数据分析和网络研究领域,聚类算法和网络分析方法起着至关重要的作用。本文将深入探讨两种重要的技术:复杂网络中的差分介数(Differential Betweenness)以及一种新颖的广义C均值聚类方法(GeCiM)。
复杂网络中的差分介数
在复杂网络聚类中,差分介数(DB)是一种重要的度量指标。与传统的Girvan - Newman(GN)介数相比,DB在捕捉问题的自然聚类方面表现更为出色。通过计算共表型相关系数(cophenetic correlation coefficients),DB得到的值为0.44,而GN为0.32,这表明DB在聚类效果上更具优势。
虽然仅一个示例可能不足以完全说明差分介数的实际行为,但该示例是一个著名的基准,能以简单的方式揭示DB的良好特性。实际上,很容易找到许多其他DB表现良好的例子。
时间复杂度分析
差分介数的计算涉及到许多有趣的问题,其中消除重新计算步骤的重要性值得强调。
DB和GN介数都需要计算给定网络的最短路径矩阵。对于无权网络,可以使用广度优先搜索在O(mn)时间内完成。然而,GN算法由于重新计算,需要将此过程重复m次,导致时间复杂度为O(m²n)。而DB矩阵可以使用计算出的最短路径矩阵,在最坏情况下以O(mn²)的时间计算得到,总体复杂度为O(mn) + O(mn²) = O(mn²)。
对于稠密图,DB在复杂度上有一个数量级的提升;对于稀疏图,两种算法的复杂度均为O(n³),但实际上常数不同。DB的计算涉及对最短路径矩阵进行m次O(n²)的简单算术运算,而GN在每次迭代中需要大量的图遍历操作。
超级会员免费看
订阅专栏 解锁全文
901

被折叠的 条评论
为什么被折叠?



