加权网络中的结构特征检测与生长模型研究
在网络研究领域,加权网络的分析至关重要,它能揭示许多复杂系统中的隐藏结构和规律。本文将深入探讨加权网络中显著结构特征的检测方法,以及几种不同的网络生长模型。
1. 加权网络中的模体分析
在加权网络里,模体分析不能仅仅局限于统计特定小图出现的次数。以三角形为例,评估其在加权网络中的相关性时,不仅要考虑三角形的数量,还要关注每个三角形中三条边的权重值。
为了更准确地分析,引入了强度(intensity)和相干性(coherence)这两个概念:
-
强度(I(Fw))
:衡量子图边权重的典型值,定义为 (I(Fw) = \left(\prod_{(ij) \in LF} w_{ij}\right)^{\frac{1}{l}}),这里 (w_{ij}) 是边 ((i, j)) 的权重。
-
相干性(Q(Fw))
:量化权重的多样性,定义为 (Q(Fw) = \frac{I(Fw)}{\frac{1}{l} \sum_{(ij) \in LF} w_{ij}})。
而图 (F \equiv F_{n,l}) 作为加权图 (G_w) 的子图时,其强度 (I_F) 和相干性 (Q_F) 分别定义为所有与 (F_{n,l}) 拓扑等价的加权子图 (F_w^{n,l}) 的强度和相干性之和:
(I_F = \sum_{F_w} I(F_w))
(Q_F = \sum_{F_w} Q(F_w))
通过计算这两个值,我们能更全面地了解加权网络中特定模式的权重分布情况。为了评估这些值的显著性,需要将图 (G_w) 与相应的随机化版本进行比较,引入了强度 (Z) 分数 (Z_{I_F}) 和相干性 (Z) 分数 (Z_{Q_F}):
(Z_{I_F} = \frac{I_F - I_{rand}^F}{\sigma_{rand}^{I_F}})
(Z_{Q_F} = \frac{Q_F - Q_{rand}^F}{\sigma_{rand}^{Q_F}})
其中 (I_{rand}^F) 和 (\sigma_{rand}^{I_F}) 分别是随机化图集合中强度的均值和标准差,(Q_{rand}^F) 和 (\sigma_{rand}^{Q_F}) 同理。
下面通过一个例子来具体说明:
假设有一个加权图 (G_w),有 (N = 7) 个节点和 (K = 11) 条边,我们计算其中三角形的强度和相干性。该图有五个加权三角形,分别为 ((1, 2, 3))、((2, 3, 4))、((2, 4, 5))、((4, 5, 6)) 和 ((5, 6, 7)),各三角形的强度和相干性值如下表所示:
| 三角形 | 强度 (I(Fw)) | 相干性 (Q(Fw)) |
| ---- | ---- | ---- |
| ((1, 2, 3)) | 1.0 | 1.0 |
| ((2, 3, 4)) | - | - |
| ((2, 4, 5)) | - | - |
| ((4, 5, 6)) | 0.1 | 1.0 |
| ((5, 6, 7)) | - | 最小相干性 |
如果考虑 200 次图的随机化,在零模型中三角形的平均强度 (I_{rand}^F = 2.34),标准差 (\sigma_{rand}^{I_F} = 0.76);平均相干性 (Q_{rand}^F = 2.42),标准差 (\sigma_{rand}^{Q_F} = 0.61)。由此可计算出第一个图中三角形的强度分数 (Z_{I_F} = 0.47),第二个图中 (Z_{I_F} = 1.89);第一个图的相干性分数 (Z_{Q_F} = 2.57),第二个图 (Z_{Q_F} = 1.49)。这表明第一个图中三角形的相干性与零模型有显著差异。
2. 加权网络中的社区结构检测
在加权网络中检测社区结构时,可以将之前未加权网络中模块化的定义扩展到加权网络。
给定加权图 (G_w) 和其节点的一个划分 (P_N = {C_1, C_2, \ldots, C_M}),加权模块化 (Q_w^P) 可以定义为:
(Q_w^P = \sum_{m = 1}^{M} \left(\frac{W_{mm}}{W} - \left(\frac{W_m}{2W}\right)^2\right))
其中 (W_m) 是集合 (C_m) 的强度,即集合 (C_m) 中所有节点强度之和;(W_{mm}) 是连接集合 (C_m) 中节点的边的权重之和;(2W) 是加权图 (G_w) 的总强度。
也可以将加权模块化重写为节点对的求和形式:
(Q_w^P = \frac{1}{2W} \sum_{ij} \left(w_{ij} - \frac{s_is_j}{2W}\right) \delta(C(i), C(j)))
这里 (C(i)) 表示包含节点 (i) 的簇,(\delta(C(i), C(j))) 是克罗内克函数,当节点 (i) 和 (j) 在同一簇时取值为 1,否则为 0。
下面通过两个例子说明加权模块化在社区结构检测中的应用:
-
Zachary 空手道俱乐部网络
:可以将其视为加权网络,使用 Louvain 算法寻找社区。在未加权和加权情况下,算法都找到 (M = 4) 个社区,未加权时模块化 (Q = 0.419),加权时 (Q_w = 0.445)。两种情况下的划分几乎相同,仅节点 10 被分配到不同社区,归一化互信息 (I = 0.923)。
-
美国航空运输网络
:加权网络和未加权网络的社区结构差异较大。加权图的最佳划分有 (M = 14) 个社区,未加权网络有 (M = 15) 个社区,且两个网络社区的大小和组成有很大不同,归一化互信息 (I = 0.549)。
3. 加权网络生长模型
在现实世界中,大多数加权网络是通过生长过程形成的,下面介绍几种不同的加权网络生长模型:
3.1 Antal–Krapivsky(AK)模型
该模型是生长加权无标度网络的最小模型,网络的结构增长与边权重通过 BA 优先连接规则的推广相耦合。
给定三个正整数 (N)、(n_0) 和 (m)((m \leq n_0 \ll N)),在 (t = 0) 时,从一个有 (n_0) 个节点和 (l_0 = \frac{n_0(n_0 - 1)}{2}) 条等权重边的完全图开始。在 (t = 1, 2, 3, \ldots, N - n_0) 时,重复以下三个步骤:
1. 添加一个新节点 (n = n_0 + t),该节点带有 (m) 条边。
2. 这 (m) 条边将新节点连接到系统中已存在的 (m) 个不同节点,新边连接新节点 (n) 到节点 (i) 的概率为 (\Pi_{n \to i} = \frac{s_{i,t - 1}}{\sum_{l = 1}^{n - 1} s_{l,t - 1}}),其中 (s_{i,t}) 是节点 (i) 在时间 (t) 的强度。
3. 每条边被分配一个从分布 (q(w)) 中抽取的正权重。
这个模型的优点是可以进行解析求解,对于大的 (N),强度分布 (r(s)) 趋近于一个具有普遍尾部 (r(s) \sim s^{-3}) 的平稳分布,且与输入的边权重分布函数 (q(w)) 无关。
3.2 Barrat–Barthélemy–Vespignani(BBV)模型
该模型考虑了网络生长过程中边权重的动态变化,具有权重驱动的动力学和局部链接强化机制。
给定三个正整数 (N)、(n_0) 和 (m)((m \leq n_0 \ll N)),在 (t = 0) 时,从一个有 (n_0) 个节点和 (l_0 = \frac{n_0(n_0 - 1)}{2}) 条边的完全图开始,所有边权重都设为 (w_0 > 0)。在 (t = 1, 2, 3, \ldots, N - n_0) 时,重复以下步骤:
1. 添加一个新节点 (n = n_0 + t),该节点带有 (m) 条权重均为 (w_0) 的边。
2. 这 (m) 条边将新节点连接到系统中已存在的 (m) 个不同节点,新边连接新节点 (n) 到节点 (i) 的概率为 (\Pi_{n \to i} = \frac{s_{i,t - 1}}{\sum_{l = 1}^{n - 1} s_{l,t - 1}})。
3. 新边 ((n, i)) 的存在会根据规则 (w_{il,t} = w_{il,t - 1} + \delta \frac{w_{il,t - 1}}{s_{i,t - 1}}) 对节点 (i) 与其邻居 (l) 之间的权重进行局部重排,其中 (\delta \geq 0)。
该模型生成的网络表现出幂律分布的边权重、节点度和节点强度,且幂律指数与模型的两个主要控制参数 (\delta) 和 (w_0) 有关。当 (\delta \to 0) 时,模型等价于 BA 模型。
下面通过一个 mermaid 流程图展示 BBV 模型的网络生长过程:
graph LR
A[开始] --> B[添加新节点 n]
B --> C[连接 m 条边到已有节点]
C --> D[局部权重重排]
D --> E{是否达到 N - n_0 次迭代}
E -- 否 --> B
E -- 是 --> F[结束]
通过以上对加权网络的模体分析、社区结构检测以及生长模型的研究,我们能更深入地理解加权网络的特性和演化规律,为解决实际问题提供有力的理论支持。
3.3 Dorogovtsev–Mendes(DM)模型
与 BBV 模型不同,DM 模型中是高权重的边吸引新的连接并增加自身权重。在 (t = 0) 时,从一条权重为 1 的边开始,在 (t = 1, 2, 3, \ldots, N - 2) 时,重复以下步骤:
1. 以与边权重成正比的概率选择图中的一条边 ((i, j)),并将其权重增加一个常数 (\delta > 0),即 (w_{ij,t} = w_{ij,t - 1} + \delta)。
2. 添加一个新节点 (n = 2 + t),并将其通过权重为 1 的边连接到节点 (i) 和 (j)。
该模型也可以进行解析求解,在大 (N) 的极限下,生成网络的边权重、节点度和节点强度分布均为幂律分布,指数分别为 (\gamma_w = 2 + \frac{2}{\delta}) 和 (\gamma = \gamma_s = 2 + \frac{1}{1 + \delta})。
以下是 DM 模型网络生长过程的表格总结:
|步骤|操作|
| ---- | ---- |
|1|选择边并增加权重|
|2|添加新节点并连接到所选边的两端|
3.4 Kumpula–Onnela–Saramäki–Kaski–Kertèsz(KOSKK)模型
该模型考虑了社交网络中两种重要的链接形成机制:三元闭包和焦点闭包,并且可以生成具有可调社区结构的加权网络。
给定一个大的正整数 (N),(0 < w_0),(0 \leq \delta \leq w_0),(0 \leq p_{\triangle} \leq 1),(0 \leq p_r \leq 1) 和 (0 \leq p_d \leq 1),从 (N) 个孤立节点开始,迭代重复以下三个步骤:
1.
局部搜索与链接形成
:随机选择一个节点 (i),若 (i) 至少有一个邻居 (j),则以概率 (\frac{w_{ij}}{s_i}) 选择 (j);若 (j) 除 (i) 外还有其他邻居 (k),则以概率 (\frac{w_{jk}}{s_j - w_{ij}}) 选择 (k)。若边 ((i, k)) 已存在,其权重增加 (\delta);若不存在,以概率 (p_{\triangle}) 创建权重为 (w_0) 的边 ((i, k))。同时,(w_{ij}) 和 (w_{jk}) 也增加 (\delta)。
2.
全局链接形成
:若步骤 1 中选择的节点 (i) 没有链接,或者以全局连接概率 (p_r),创建一条权重为 (w_0) 的边连接到随机选择的节点 (l)。
3.
链接删除
:以删除概率 (p_d) 随机选择一个节点并移除其所有链接。
这个模型较为复杂,有多个控制参数。当 (\delta = 0) 时,得到无社区结构的未加权网络;当 (\delta > 0) 时,会出现社区结构,且随着 (\delta) 的增加,社区划分更加明显。
下面是 KOSKK 模型的 mermaid 流程图:
graph LR
A[开始] --> B[随机选节点 i]
B --> C{i 有邻居?}
C -- 是 --> D[选邻居 j]
D --> E{j 有其他邻居?}
E -- 是 --> F[选邻居 k]
F --> G{(i, k) 已存在?}
G -- 是 --> H[增加 (i, k) 权重]
G -- 否 --> I{以 p_△ 创建 (i, k)}
I -- 是 --> J[创建 (i, k) 边]
H --> K[增加 w_ij 和 w_jk 权重]
J --> K
C -- 否 --> L{以 p_r 创建边}
L -- 是 --> M[连到随机节点 l]
K --> N{以 p_d 删除节点边}
N -- 是 --> O[删除节点边]
N -- 否 --> P{是否继续迭代}
M --> P
P -- 是 --> B
P -- 否 --> Q[结束]
4. 弱链接的强度
在社会网络研究中,弱链接起着至关重要的作用。Mark Granovetter 的研究表明,弱链接能够连接社会网络中原本难以通过强链接到达的部分。在 KOSKK 模型中,当 (\delta > 0) 形成社区结构时,可以观察到连接不同社区的是绿色(小权重)的边,这正好验证了弱链接在连接不同社区方面的重要性。
总结
本文全面探讨了加权网络的多个方面。在模体分析中,通过引入强度和相干性的概念,能够更准确地评估加权网络中特定子图的相关性。在社区结构检测方面,扩展了模块化的定义到加权网络,通过实际例子展示了考虑边权重对社区划分的影响。在网络生长模型部分,介绍了 AK、BBV、DM 和 KOSKK 四种不同的模型,它们各自具有独特的生长机制,生成的网络也表现出不同的特性。这些研究成果有助于我们更深入地理解加权网络的结构和演化规律,为解决诸如社交网络分析、交通网络规划等实际问题提供了理论基础和方法支持。未来,我们可以进一步探索这些模型在不同领域的应用,以及如何优化这些模型以更好地适应实际情况。
超级会员免费看
1183

被折叠的 条评论
为什么被折叠?



