16、图论与自催化网络的演化

图论与自催化网络的演化

1. 引言

网络研究在多个层面具有重要意义。其一,可用于描述自然和人造网络的结构,如生态系统中的食物网、生物体内的生化和神经网络、社会中的社交网络以及互联网等。图论为捕捉网络结构的各个方面提供了重要工具。其二,关注网络结构如何影响系统中的现象,例如生态系统的食物网结构会影响物种的种群动态,人类接触网络会影响传染病的传播。在这一层面,网络通常被视为静态的,主要关注其他变量在固定结构网络上的动态。其三,研究网络自身随时间的变化。生化、神经、生态、社会和技术网络并非静态,而是进化的产物,其进化过程相当复杂,有时会自我组织并增长,有时会解体。

生命起源问题很好地体现了上述三个层面。地球上最简单的生命结构——细菌细胞,是由数千种分子通过复杂的化学反应网络相互作用形成的。这些分子网络可以用图来描述,节点代表分子种类,链接代表分子间的化学反应。生命起源的一个谜题是,在最初没有这样的复杂网络和相关过程的情况下,它们是如何自我形成的。另一个谜题是,细胞中的分子和描述它们相互作用的图具有高度的结构性,这种结构通过纯粹的偶然产生的概率极小,那么是什么机制创造了这种高度结构化的组织呢?

为了解决这些问题,我们引入了一种动态系统模型,其中描述网络的图也是一个动态变量,其动态与其他变量(如分子种类的种群)相互耦合。该模型展示了一种机制,通过形成小分子自催化集,化学组织可以从无到有地出现,并在短时间内发展成复杂且高度结构化的化学组织。此外,该模型还能捕捉到生物和社会系统进化中常见的一些现象,如合作与相互依赖的出现、系统的崩溃与恢复、“核心转移”、“关键物种”的出现等。

2. 图论与自催化集

2.1 有向图及其邻接矩阵

有向图 (G = G(S, L)) 由一组节点 (S) 和一组链接 (L) 定义,每个链接是节点的有序对。对于一个有 (s) 个节点的图,用整数标记节点 (S = {1, 2, \ldots, s}) 较为方便。有向图可以用一个 (s \times s) 的矩阵 (C = (c_{ij})) 完全表示,称为图的邻接矩阵。如果链接 (L) 中存在从节点 (j) 到节点 (i) 的有向链接,则 (c_{ij} = 1),否则 (c_{ij} = 0)。

无向图是有向图的特殊情况,其邻接矩阵是对称的。一个无向图的链接可以看作是两个有向链接。图 (G’) 是图 (G) 的子图,如果 (S’ \subset S) 且 (L’ \subset L),并且 (L) 中两端点都在 (S’) 中的所有链接也属于 (L’)。

从节点 (i_1) 到节点 (i_{n + 1}) 的长度为 (n) 的行走是节点和链接的交替序列。如果所有节点都不同(除了可能的第一个和最后一个节点),则称为路径。如果第一个和最后一个节点相同,则称为封闭行走或路径。图中存在一个封闭行走意味着存在无限多个不同的行走。

如果 (C) 是图的邻接矩阵,那么 ((C^n)_{ij}) 等于从节点 (j) 到节点 (i) 的长度为 (n) 的不同行走的数量。

2.2 佩龙 - 弗罗贝尼乌斯特征值和特征向量(PFEs)

对于一个 (s \times s) 的矩阵 (C),向量 (x = (x_1, x_2, \ldots, x_s)) 是其特征向量,特征值为 (\lambda),如果对于每个 (i),(\sum_{j = 1}^{s} c_{ij}x_j = \lambda x_i)。矩阵 (C) 的特征值是其特征方程 (|C - \lambda I| = 0) 的根,其中 (I) 是与 (C) 同维的单位矩阵。

对于非负矩阵,佩龙 - 弗罗贝尼乌斯定理保证存在一个实特征值,其大小大于或等于所有其他特征值。这个最大特征值称为矩阵的佩龙 - 弗罗贝尼乌斯特征值,记为 (\lambda_1(C))。此外,还存在一个对应于 (\lambda_1(C)) 的特征向量,其所有分量都是实的且非负,称为佩龙 - 弗罗贝尼乌斯特征向量(PFE)。

图中是否存在封闭路径可以通过其邻接矩阵的佩龙 - 弗罗贝尼乌斯特征值来确定:
- 若图没有封闭行走,则 (\lambda_1(C) = 0);
- 若图有封闭行走,则 (\lambda_1(C) \geq 1);
- 若图有封闭行走且所有封闭行走仅出现在循环子图中,则 (\lambda_1(C) = 1)。

2.3 不可约图和矩阵

有向图的子图如果从子图中的每个节点到其他每个节点都存在路径,则称为不可约子图。最简单的不可约子图是 1 - 循环。如果图或子图是不可约的,则对应的邻接矩阵也称为不可约矩阵。

任何图的节点都可以分组为一组唯一的不可约子图,具体步骤如下:
1. 选择任意节点 (i),找到所有从 (i) 出发有路径到达的节点,记为集合 (S_1);同样,找到所有有路径到达 (i) 的节点,记为集合 (S_2)。由节点集合 ({i} \cup (S_1 \cap S_2)) 及其所有相互链接组成的子图记为 (C_1)。如果 (S_1 \cap S_2 \neq \varnothing),则 (C_1) 是不可约图;如果 (S_1 \cap S_2 = \varnothing),则 (i) 不属于任何不可约子图,(C_1) 仅由节点 (i) 组成,没有链接。
2. 选择一个不在 (C_1) 中的节点,重复上述过程得到另一个子图 (C_2),两个子图的节点集合是不相交的。
3. 重复这个过程,直到所有节点都被分配到某个 (C_{\alpha}),(\alpha = 1, 2, \ldots, M)。每个 (C_{\alpha}) 要么是不可约子图,要么是没有链接的单个节点。

2.4 一般图的结构

通过对节点重新编号,可以将一般的邻接矩阵重写为有用的形式。首先确定图的所有子图 (C_1, C_2, \ldots, C_M),然后构建一个新的图,其中每个节点对应一个 (C_{\alpha})。如果在原始图中 (C_{\beta}) 的任何节点有链接到 (C_{\alpha}) 的任何节点,则新图中存在从 (C_{\beta}) 到 (C_{\alpha}) 的有向链接。

得到的新图不能有封闭路径,因此可以对 (C_{\alpha}) 进行重新编号,使得如果 (\alpha > \beta),(C_{\beta}) 永远不会在 (C_{\alpha}) 的下游。然后对原始图的节点进行重新编号,使得属于给定 (C_{\alpha}) 的节点占据连续的节点编号。这样,邻接矩阵具有以下规范形式:
[
C =
\begin{pmatrix}
C_1 & 0 & \cdots & 0 \
R_{21} & C_2 & \cdots & 0 \
\vdots & \vdots & \ddots & \vdots \
R_{M1} & R_{M2} & \cdots & C_M
\end{pmatrix}
]
其中 (0) 表示矩阵的上三角部分仅包含零,而下部三角部分 (R) 通常不为零。

从上述形式的 (C) 可以得出,(|C - \lambda I| = |C_1 - \lambda I| \times |C_2 - \lambda I| \times \cdots \times |C_M - \lambda I|),因此 (C) 的特征值集合是 (C_1, \ldots, C_M) 特征值集合的并集,(\lambda_1(C) = \max_{\alpha}{\lambda_1(C_{\alpha})})。如果图 (C) 的佩龙 - 弗罗贝尼乌斯特征值 (\lambda_1 > 0),则它至少包含一个佩龙 - 弗罗贝尼乌斯特征值为 (\lambda_1) 的不可约子图。当 (\lambda_1 > 0) 时,所有佩龙 - 弗罗贝尼乌斯特征值等于 (\lambda_1) 的不可约子图称为基本子图。

2.5 自催化集

自催化集(ACS)的概念最初是在一组催化相互作用的分子的背景下引入的,定义为一组分子种类,其中每个成员种类都有一个催化剂。这样的分子集合在某些情况下可以集体自我复制,即使其单个成员分子不能单独自我复制。在有向图中,自催化集定义为一个子图,其中每个节点至少有一个来自同一子图中节点的入边。

循环、不可约子图和自催化集之间存在层次关系:所有循环都是不可约子图,所有不可约子图都是自催化集,但并非所有自催化集都是不可约子图,也并非所有不可约子图都是循环。

自催化集具有以下性质:
- 自催化集必须包含封闭路径;
- 如果图 (C) 没有自催化集,则 (\lambda_1(C) = 0);
- 如果图 (C) 有自催化集,则 (\lambda_1(C) \geq 1)。

2.6 自催化集与佩龙 - 弗罗贝尼乌斯特征向量的关系

自催化集与佩龙 - 弗罗贝尼乌斯特征向量(PFE)有密切联系。设 (x) 是图的一个 PFE,考虑所有 (x_i) 非零的节点集合,由这些节点及其相互链接组成的子图称为“PFE (x) 的子图”。如果 PFE 的所有分量都非零,则 PFE 的子图就是整个图。

可以证明,如果 (\lambda_1(C) > 0),则图 (C) 的任何 PFE 的子图都是自催化集。但反之不成立,即对于图中的每个自催化集,不一定存在对应的 PFE。

设 (x) 是图 (C) 的一个 PFE,(C’) 是 (x) 的子图的邻接矩阵,(\lambda_1(C’)) 是 (C’) 的佩龙 - 弗罗贝尼乌斯特征值,则 (\lambda_1(C’) = \lambda_1(C))。

2.7 简单 PFE 的核心和外围

如果 (C’) 是简单 PFE 的子图,包含在 (C’) 中的 (C) 的基本子图称为 (C’) 的核心,记为 (Q’)。(C’) 中不在核心的其余节点和链接构成其外围。

核心和外围具有以下拓扑性质:从简单 PFE 子图的核心中的每个节点都存在一条路径通向 PFE 子图的其他每个节点;从外围节点没有路径通向核心节点。因此,所有外围节点都在所有核心节点的下游。

根据不可约图的佩龙 - 弗罗贝尼乌斯定理,向核心添加任何链接必然会增加 (\lambda_1(Q’)),同样,移除任何链接会降低 (\lambda_1(Q’))。因此,(\lambda_1) 衡量了核心内部路径的多样性。

2.8 非简单 PFE 的核心和外围

任何图的 PFE 都可以写成一组简单 PFE 的线性组合,因此核心和外围的定义可以扩展到任何 PFE。PFE 的核心 (Q) 是那些线性组合形成给定 PFE 的简单 PFE 的核心的并集,PFE 子图的其余节点和链接构成其外围。由此可得 (\lambda_1(Q) = \lambda_1(C))。当核心是不相交循环的并集时,(\lambda_1(Q) = 1),反之亦然。

2.9 没有自催化集时 PFE 的结构

当 (\lambda_1(C) = 0) 时,图没有自催化集。此时,图的每个连通分量都存在一个 PFE。由于图中没有封闭行走,所有行走的长度都是有限的。考虑给定连通分量中的最长路径,确定这些最长路径的端点节点。对应于该连通分量的 PFE 对于这些端点节点的 (x_i > 0),对于图中的其他所有节点 (x_i = 0)。一般的 PFE 是所有这些 PFE 的线性组合,每个连通分量对应一个。在这种情况下,由于没有封闭路径,图的任何 PFE 都没有核心(或外围),所有 PFE 的核心可以定义为空集 (Q = \varnothing)。

3. 固定图上的动态系统

在前面的章节中,我们讨论了图及其相关的邻接矩阵、特征值和特征向量的性质。在本节中,我们将探讨这些概念的动态意义。具体来说,我们将介绍一个在固定图上的动态系统,由一组耦合的常微分方程描述,其吸引子恰好是前面讨论的佩龙 - 弗罗贝尼乌斯特征向量(PFE)。这个动态系统是一组化学物质种群动态的理想化模型。

考虑 (s) 维归一化非负向量的单纯形:(J = {x \equiv (x_1, x_2, \ldots, x_s) \in \mathbb{R}^s | 0 \leq x_i \leq 1, \sum_{i = 1}^{s} x_i = 1})。对于一个有 (s) 个节点的固定图 (C = (c_{ij})),考虑以下一组耦合的常微分方程:
[
\dot{x} i = \sum {j = 1}^{s} c_{ij}x_j - x_i \sum_{j, k = 1}^{s} c_{kj}x_j
]

这个动态系统具有以下特点:
- 动态过程保持 (x) 的归一化,即 (\sum_{i = 1}^{s} \dot{x}_i = 0)。对于非负的 (C),它使单纯形 (J) 保持不变。
- 图的链接表示生活在节点上的变量 (x_i) 之间的相互作用。(x_i) 可以表示,例如,(s) 种物种种群中第 (i) 种物种的相对种群数量,或者一组 (s) 种策略中第 (i) 种策略的概率,或者一组竞争公司中第 (i) 家公司的市场份额等。

3.1 方程的推导

设 (i \in {1, \ldots, s}) 表示化学反应器中的一种化学(或分子)物种。分子之间可以以各种方式相互反应,我们关注它们相互作用的一个方面:催化。催化相互作用可以用一个有 (s) 个节点的有向图来描述,节点代表 (s) 种物种,从节点 (j) 到节点 (i) 的链接存在意味着物种 (j) 是物种 (i) 产生的催化剂。在邻接矩阵 (C = {c_{ij}}) 中,如果 (j) 是 (i) 的催化剂,则 (c_{ij}) 设为 1,否则设为 0。

每种物种 (i) 在反应池中都有一个相关的非负种群 (y_i),其随时间变化。在一定近似下,对于一组固定的化学物种,其相互作用由 (C) 给出,种群动态方程为:
[
\dot{y} i = \sum {j = 1}^{s} c_{ij}y_j - \varphi y_i
]
其中 (\varphi(t)) 是时间的某个函数。例如,假设物种 (j) 催化反应物 (A) 和 (B) 连接形成物种 (i),即 (A + B \xrightarrow{j} i),则在充分搅拌的反应器中,物种 (i) 的种群 (y_i) 的增长率为 (\dot{y} i = k(1 + \nu y_j)n_A n_B - \varphi y_i),其中 (n_A, n_B) 是反应物浓度,(k) 是自发反应的速率常数,(\nu) 是催化效率,(\varphi) 表示反应器中的共同死亡率或稀释通量。假设催化反应比自发反应快得多,并且反应物浓度大且固定,则速率方程变为 (\dot{y}_i = K y_j - \varphi y_i),其中 (K) 是常数。一般来说,由于物种 (i) 可以有多个催化剂,我们得到 (\dot{y}_i = \sum {j = 1}^{s} K_{ij}y_j - \varphi y_i),其中 (K_{ij} \sim c_{ij})。进一步理想化 (K_{ij} = c_{ij}),得到上述方程。

物种 (i) 的相对种群定义为 (x_i \equiv \frac{y_i}{\sum_{j = 1}^{s} y_j}),因此 (x \equiv (x_1, \ldots, x_s) \in J)。对 (x_i) 求时间导数并使用上述方程,很容易得到 (\dot{x}_i) 的表达式。注意,(\varphi) 项在推导过程中抵消,在 (\dot{x}_i) 的表达式中不存在。

3.2 方程 (16.1) 的吸引子

对于任何图 (C),有以下命题:
1. (C) 的每个属于 (J) 的特征向量都是方程 (16.1) 的一个固定点,反之亦然。
2. 从单纯形 (J) 中的任何初始条件开始,轨迹收敛到 (J) 中的某个固定点(通常记为 (X))。
3. 对于 (J) 中的一般初始条件,(X) 是图 (C) 的佩龙 - 弗罗贝尼乌斯特征向量(PFE)。(对于形成 (J) 中测度为零的空间的特殊初始条件,(X) 可能是 (C) 的其他特征向量。此后我们忽略这些特殊初始条件。)
4. 如果 (C) 有唯一的 PFE,(X) 是方程 (16.1) 的唯一稳定吸引子。
5. 如果 (C) 有多个线性独立的 PFE,则 (X) 可能取决于初始条件。允许的 (X) 的集合是一部分 PFE 的凸线性组合。在这个意义上,(J) 中这个凸集的内部可以称为方程 (16.1) 的“吸引子”,因为对于一般初始条件,所有轨迹都收敛到这个集合中的一个点。
6. 对于属于吸引子集的每个 (X),(X_i > 0) 的节点集合是相同的,并且由 (C) 唯一确定。由这些节点组成的子图称为图 (C) 的方程 (16.1) 的“吸引子子图”。从物理上讲,这个集合包含在动态过程 (16.1) 从一般初始条件开始运行结束后,最终相对种群不为零的节点。
7. 如果 (\lambda_1(C) > 0),方程 (16.1) 的吸引子子图是一个自催化集。这个自催化集称为图的主导自催化集。主导自催化集与(一般)初始条件无关,仅取决于 (C)。

3.3 吸引子的示例

以下是一些不同图的示例,展示了上述命题的应用:
1. 简单链 :邻接矩阵的所有特征值(包括 (\lambda_1))都为零。只有一个(归一化)对应于该特征值的特征向量,即 (e = (0, 0, 1)),这是图的唯一 PFE。由于节点 1 没有催化剂,其速率方程为 (\dot{y} 1 = 0),所以 (y_1(t) = y_1(0)) 为常数。节点 2 的速率方程为 (\dot{y}_2 = y_1 = y_1(0)),则 (y_2(t) = y_2(0) + y_1(0)t)。节点 3 的速率方程为 (\dot{y}_3 = y_2),则 (y_3(t) = \frac{1}{2}y_1(0)t^2 + y_2(0)t + y_3(0))。在大 (t) 时,(y_1) 为常数,(y_2 \sim t),(y_3 \sim t^2),因此 (y_3) 占主导。所以,(X_i = \lim {t \to \infty} x_i(t)) 为 (X_1 = 0),(X_2 = 0),(X_3 = 1),即 (X) 等于唯一的 PFE (e),与初始条件无关。
2. 1 - 循环 :图有两个特征值,(\lambda_1 = 1),(\lambda_2 = 0)。唯一的 PFE 是 (e = (1, 0))。速率方程为 (\dot{y}_1 = y_1),(\dot{y}_2 = 0),解为 (y_1(t) = y_1(0)e^t),(y_2(t) = y_2(0))。在大 (t) 时,节点 1 占主导,因此 (X = (1, 0) = e)。节点 1 的指数增长是因为它是一个自我复制者,如方程 (\dot{y}_1 = y_1) 所示。
3. 2 - 循环 :对应的邻接矩阵有特征值 (\lambda_1 = 1),(\lambda_2 = -1)。唯一归一化的 PFE 是 (e = (\frac{1}{2}, \frac{1}{2}))。种群动态方程为 (\dot{y}_1 = y_2),(\dot{y}_2 = y_1),通解为 (y_1(t) = A e^t + B e^{-t}),(y_2(t) = A e^t - B e^{-t})。在大 (t) 时,(y_1 \to A e^t),(y_2 \to A e^t),因此 (X = (\frac{1}{2}, \frac{1}{2}) = e)。节点 1 和 2 单独都不是自我复制的物种,但它们共同作为一个自我复制的实体起作用,这对于所有自催化集都是如此。
4. 带外围的 2 - 循环 :图的 (\lambda_1 = 1),唯一归一化的 PFE 是 (e = (\frac{1}{3}, \frac{1}{3}, \frac{1}{3}))。(y_1) 和 (y_2) 的种群方程及其通解与示例 3 相同,但现在还有 (\dot{y}_3 = y_2),得到 (y_3(t) = A e^t + B e^{-t} + \text{常数})。在大 (t) 时,(y_1, y_2, y_3) 都以 (\sim A e^t) 的速度增长,因此 (X = (\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) = e)。主导自催化集包括所有三个节点。这个例子展示了一个寄生外围(不反馈到核心)如何由自催化核心支持。
5. 2 - 循环和链 :图结合了简单链和 2 - 循环的结构。在大 (t) 时,链中节点的种群增长为幂函数,而 2 - 循环中节点的种群呈指数增长。因此,吸引子将是 (X = (0, 0, 0, \frac{1}{2}, \frac{1}{2})),这是图的一个 PFE(特征值为 1 的特征向量)。一般来说,当图由一个或多个自催化集和其他不属于任何自催化集的节点组成时,自催化集节点的种群呈指数增长,而其他节点的种群最多以幂函数增长。因此,自催化集在种群动态中总是优于非自催化结构。
6. 2 - 循环和另一个不可约图 :图包含两个自催化集,2 - 循环子图的佩龙 - 弗罗贝尼乌斯特征值为 1,另一个不可约子图的佩龙 - 弗罗贝尼乌斯特征值为 (\sqrt{2})。整个图的唯一 PFE 是 (e = \frac{(0, 0, 1, \sqrt{2}, 1)}{2 + \sqrt{2}}),特征值为 (\sqrt{2})。节点 3, 4 和 5 的种群也呈指数增长,但速度更快,反映了包含这些节点的子图的更高佩龙 - 弗罗贝尼乌斯特征值。因此,这个结构最终会超过 2 - 循环,吸引子是 (X = e)。在这种情况下,主导自催化集是由节点 3, 4 和 5 形成的不可约子图。
7. 一个 2 - 循环在另一个 2 - 循环下游 :在图中,节点 3 和 4 形成的 2 - 循环在节点 1 和 2 形成的 2 - 循环下游。唯一的 PFE 是 (e = (0, 0, \frac{1}{2}, \frac{1}{2}))。在大 (t) 时,虽然所有四个节点都以相同的速率 (\lambda_1) 呈指数增长,但 (y_3) 和 (y_4) 会超过 (y_1) 和 (y_2)。吸引子将是 (X = (0, 0, \frac{1}{2}, \frac{1}{2}) = e)。这里主导自催化集是节点 3 和 4 形成的 2 - 循环。这个结果推广到其他类型的自催化集:如果一个不可约子图在另一个具有相同佩龙 - 弗罗贝尼乌斯特征值的不可约子图下游,那么前者在吸引子中的相对种群为零。

3.4 到达吸引子的时间

系统到达其吸引子的时间尺度取决于图 (C) 的结构。例如,在示例 2 中,吸引子的接近是因为节点 1 的种群 (y_1) 超过了种群 (y_2)。由于 (y_1) 呈指数增长为 (e^t),吸引子在时间尺度 (\lambda_1^{-1} = 1) 上到达。相反,在示例 1 中,吸引子的接近是因为 (y_3) 超过了 (y_1) 和 (y_2)。由于在这种情况下所有种群都以幂函数增长,到达吸引子的时间尺度是无限的。

一般来说,这个时间尺度取决于最快增长种群和次快增长种群之间的增长率差异。对于没有基本子图的图(如示例 1 和 8 中的图,(\lambda_1 = 0)),所有种群都以幂函数增长,因此到达吸引子的时间尺度是无限的。对于有一个或多个基本子图但所有基本子图都在不同连通分量中的图(如示例 2 - 6),到达吸引子的时间尺度由 ((\lambda_1 - \text{Re}\lambda_2)^{-1}) 给出,其中 (\lambda_2) 是 (C) 的实部次大的特征值。对于有一个或多个基本子图且至少有一个基本子图在另一个基本子图下游的图(如示例 7, 9 和 10),最快增长种群与次快增长种群的比率总是 (t) 的幂函数,因此到达吸引子的时间尺度也是无限的。

3.5 图的核心和外围

由于主导自催化集由 PFE 给出,我们将主导自催化集的核心定义为相应 PFE 的核心。如果 PFE 是简单的,主导自催化集的核心仅由一个基本子图组成。如果 PFE 是非简单的,主导自催化集的核心将是一些基本子图的并集。此外,主导自催化集由图唯一确定。这促使我们定义图的核心和外围:图 (C) 的核心,记为 (Q(C)),是图 (C) 的主导自催化集的核心。图 (C) 的外围是图 (C) 的主导自催化集的外围。这个定义适用于 (\lambda_1(C) > 0) 的情况。当 (\lambda_1(C) = 0) 时,图没有自催化集,根据定义 (Q(C) = \varnothing)。在所有情况下,(\lambda_1(Q(C)) = \lambda_1(C))。

3.6 两个图的核心重叠

给定任何两个节点已标记的图 (C) 和 (C’),它们之间的核心重叠,记为 (Ov(C, C’)),是 (C) 和 (C’) 的核心中共同链接的数量,即有序对 ((j, i)) 的数量,其中 (Q_{ij}) 和 (Q’_{ij}) 都非零。如果 (C) 或 (C’) 没有核心,则 (Ov(C, C’)) 恒为零。

3.7 关键节点

在生态学中,某些物种被称为关键物种,其灭绝或移除会严重破坏生态系统的平衡。在有向图中,我们可以定义关键节点的概念。考虑从图 (C) 中假设移除任何节点 (i) 的影响。如果 (C) 有非零核心且 (Ov(C, C - i) = 0),则我们称节点 (i) 为关键节点。因此,关键节点是其移除会极大改变图的组织结构(由其核心表示)的节点。

例如,在某些图中,当核心是一个单 (n) - 循环时,所有核心节点都是关键节点。在不同结构的图中,关键节点的分布不同,核心内部路径越多(通常意味着 (\lambda_1) 值越高),图拥有关键物种的可能性越小,其结构对节点移除的鲁棒性越强。

4. 图的动态

前面我们讨论了固定图的代数性质以及特定动态系统在任意但固定图上的吸引子。然而,复杂系统的一个有趣特性是其组件之间的相互作用图会随时间演化,从而产生许多有趣的自适应现象。现在我们转向这样一个例子,其中图本身是一个动态变量,并展示诸如自组织、灾难、创新等现象是如何产生的。

4.1 图动态的实现

我们考虑一个以离散步骤改变图的过程。这个过程产生的一系列图可以表示为 (C_n),(n = 1, 2, \ldots)。图更新事件是该过程的一步,将图从 (C_{n - 1}) 转变为 (C_n)。实际上,我们考虑的过程是图空间上的一个马尔可夫过程的特定示例。在时间 (n - 1),图 (C_{n - 1}) 确定了到所有其他图的转移概率。随机过程使用这个概率分布选择新图 (C_n),轨迹在图空间中向前移动。在我们考虑的例子中,转移概率没有明确指定,而是作为在固定图 (C_{n - 1}) 上快速时间尺度上发生的动态过程 (16.1) 的结果隐式产生。

图动态的实现步骤如下:
1. 初始设置 :最初,图是随机的。对于每个 (i \neq j) 的有序对 ((i, j)),(c_{ij}) 独立地以概率 (p) 被选为 1,以概率 (1 - p) 被选为 0。对于所有 (i),(c_{ii}) 设为 0。每个 (x_i) 在 ([0, 1]) 中随机选择,并且所有 (x_i) 被重新缩放,使得 (\sum_{i = 1}^{s} x_i = 1)。
2. 步骤 1 :固定 (C),根据方程 (16.1) 演化 (x),直到它收敛到一个固定点,记为 (X)。确定具有最小 (X_i) 的节点集合 (L),即 (L = {i \in S | X_i = \min_{j \in S} X_j})。
3. 步骤 2 :从 (L) 中随机选择一个节点,例如节点 (k),并将其及其所有链接从图中移除。
4. 步骤 3 :向图中添加一个新节点(也记为 (k))。根据相同的规则随机分配从 (k) 到其他节点以及从其他节点到 (k) 的链接,即对于每个 (i \neq k),(c_{ik}) 和 (c_{ki}) 独立地以概率 (p) 重新分配为 1,以概率 (1 - p) 重新分配为 0,无论它们之前的值如何,并且 (c_{kk}) 设为 0。所有其他 (C) 的矩阵元素保持不变。将 (x_k) 设置为一个小常数 (x_0),所有其他 (x_i) 从其现有值 (X_i) 进行小的扰动,并且所有 (x_i) 被重新缩放,使得 (\sum_{i = 1}^{s} x_i = 1)。

这个过程从步骤 1 开始多次迭代。

4.2 动态过程的特点

可以注意到,种群动态和图动态是相互耦合的:(x_i) 的演化在步骤 1 中依赖于图 (C),而图 (C) 的演化在步骤 2 中又依赖于 (x_i)。动态过程中有两个时间尺度,一个短时间尺度,在此期间图是固定的,(x_i) 进行演化;另一个较长的时间尺度,在此期间图发生变化。

这个动态过程的动机源于生命起源问题,特别是从初始的“随机化学汤”中如何出现复杂化学组织的谜题。我们可以想象一个史前地球上的池塘,其中包含 (s) 种分子物种,它们通过催化相互作用。在短时间尺度上,我们让物种的种群根据方程 (16.1) 演化。在较长时间尺度上,我们假设史前池塘会受到风暴、潮汐或洪水等周期性扰动,这些扰动会移除现有的物种并引入新的物种。最有可能被完全移除的物种是那些分子数量最少的物种,新物种可能具有与被移除或现有物种完全不同的催化特性。上述规则理想化地假设扰动恰好消除一个现有物种(具有最小相对种群的物种)并引入一个新物种。系统的行为并不关键依赖于这个假设。

在这个模型中,我们不允许图中存在 1 - 循环((c_{ii} = 0))。这是因为 1 - 循环代表自我复制的物种,如 RNA 分子,在史前场景中很难产生和维持,通常认为需要一个复杂的自我支持分子组织才能使 RNA 世界开始。我们希望探讨在模型中不手动引入自我复制物种的情况下,是否可以获得复杂的分子组织。

图动态的规则实现了自然进化的两个重要特征:选择和新颖性。选择通过移除“表现最差”的物种(在这种情况下,表现等同于物种的相对种群)来实现(步骤 2)。添加新物种为系统引入了新颖性。需要注意的是,虽然新节点与其他节点的实际连接是随机创建的,但新节点的平均连接性与初始节点集相同。因此,新物种在增加化学组织复杂性方面没有任何偏向。步骤 2 和步骤 3 代表了系统与外部环境的相互作用。模型的第三个特征是系统的动态依赖于其组件之间的相互作用(步骤 1)。接下来描述的现象都是这三个元素(选择、新颖性和内部动态)相互作用的结果。

4.3 图动态的 mermaid 流程图

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([初始设置]):::startend --> B(步骤 1: 固定 C,演化 x 到固定点 X):::process
    B --> C(确定最小 Xi 的节点集合 L):::process
    C --> D(从 L 中随机选节点 k 并移除):::process
    D --> E(添加新节点 k,随机分配链接):::process
    E --> F(设置 xk 为小常数,扰动其他 xi 并重新缩放):::process
    F --> G{是否继续迭代?}:::decision
    G -- 是 --> B
    G -- 否 --> H([结束]):::startend

这个流程图展示了图动态的主要步骤,从初始设置开始,经过一系列的节点移除和添加操作,然后根据是否继续迭代的判断决定是否重复这个过程。整个过程体现了图动态与种群动态的耦合,以及选择和新颖性在系统演化中的作用。

5. 自组织

现在我们来讨论图演化的结果。图的链接总数随时间(图更新次数 (n))的变化情况能反映出系统的演化阶段。当没有选择机制时,每次图更新只是随机替换一个节点,图保持随机状态,链接数量围绕随机图的值 (\approx ps^2) 波动。一旦引入选择机制,系统的行为变得更加有趣,会经历三个阶段:随机阶段、增长阶段和组织阶段。

5.1 随机阶段

初始随机图在 (p) 较小时((ps \ll 1))很可能不包含循环,因此没有自催化集,其佩龙 - 弗罗贝尼乌斯特征值 (\lambda_1 = 0)。在这个阶段,吸引子中只有处于最长路径端点的节点有非零相对种群,这些节点受到保护,不会在图更新中被淘汰。然而,这些节点的高相对种群依赖于其他支持节点,而支持节点的相对种群较低。在几次图更新后,很可能会移除一个支持节点,导致原本有非零 (X_i) 的节点不再处于最长路径的端点,从而 (X_i = 0)。最终,所有节点都会被移除和替换,图保持随机状态。

如果选择较大的 (p) 值,初始图更有可能包含循环,此时系统没有随机阶段,直接进入增长阶段。

5.2 增长阶段

在某次图更新时,一个自催化集(ACS)会偶然形成。这个事件发生的概率可以近似为 2 - 循环(最简单的 ACS)偶然形成的概率,即 (p^2s)。因此,自催化集出现的平均时间为 (\frac{1}{p^2s})。

当自催化集形成后,它的节点不能在图更新中被移除,因为它们在吸引子中有非零相对种群。新节点加入图时,会出现三种情况:
1. 新节点不与主导 ACS 相连且不形成新 ACS :主导 ACS 保持不变,新节点相对种群为零,属于最不适合的集合。在 (p) 较小时,这种情况最有可能发生。
2. 新节点从主导 ACS 获得入边并成为其一部分 :主导 ACS 增长,包含新节点。这种事件虽然在 (p) 较小时可能性较小,但却是图复杂度和结构增长的原因。
3. 新节点形成另一个 ACS :新 ACS 与现有主导 ACS 竞争,其是否成为主导取决于各自子图的佩龙 - 弗罗贝尼乌斯特征值以及它们之间的上下游关系。这种情况相对前两种较为罕见。

通常,主导 ACS 会通过逐个吸收新节点不断增长,直到整个图成为一个 ACS,此时增长阶段结束,组织阶段开始。在此过程中,(\lambda_1) 是 (n) 的非递减函数,只要 (s_1 < s)。

5.2.1 主导 ACS 增长的时间尺度

假设忽略新节点形成另一个 ACS 的情况,且主导 ACS 每次只添加一个节点,我们可以估计其覆盖整个图所需的时间。设 (n) 时刻主导 ACS 包含 (s_1(n)) 个节点,新节点从主导 ACS 获得入边并加入的概率为 (ps_1)。因此,在 (\Delta n) 次图更新中,主导 ACS 平均增长 (\Delta s_1 = ps_1\Delta n) 个节点。解这个微分方程可得 (s_1(n) = s_1(n_a)\exp((n - n_a)/\tau_g)),其中 (\tau_g = \frac{1}{p}),(n_a) 是第一个 ACS 出现的时间,(s_1(n_a)) 是第一个 ACS 的大小(通常为 2)。所以,(s_1) 预计以特征时间尺度 (\tau_g = \frac{1}{p}) 呈指数增长,从 ACS 出现到覆盖整个图所需的时间为 (\tau_g \ln(s/s_1(n_a)))。

5.2.2 演化图“结构”的度量

一个完全自催化的图是极不可能随机形成的结构。对于一个有 (s) 个节点的图,设任意一对节点之间存在正链接的概率为 (p^ ),每个节点平均有 (m^ = p^ (s - 1)) 个入边或出边。整个图成为 ACS 的概率 (P) 为:
[
P = [1 - (1 - p^
)^{s - 1}]^s = [1 - (1 - m^ /(s - 1))^{s - 1}]^s
]
在覆盖时,链接数量为 (O(s)),平均度 (m^
) 为 (O(1))。对于大 (s) 和 (m^ \sim O(1)),(P \approx (1 - e^{-m^ })^s \sim e^{-\alpha s}),其中 (\alpha) 是正的且为 (O(1))。

在本模型中,虽然节点是随机添加的,但底层的种群动态和图更新时的选择机制使得 ACS 必然在平均时间 (\tau_a = \frac{1}{p^2s}) 内出现,并在额外的 (\sim \tau_g \ln s) 时间内增长为完全自催化的图。这表明一个先验概率极小的组织可以在相对较短的时间内形成,时间随系统大小仅呈对数增长。

此外,图的“相互依赖性”也是结构的一种度量,在随机阶段较低,在增长阶段上升到约一个数量级更高的值。

5.3 组织阶段

当 ACS 覆盖整个图时,有效动态再次改变。此时,所有节点都属于主导 ACS,具有非零相对种群,但仍需选择一个节点进行移除。大多数情况下,移除具有最小 (X_i) 的节点对 ACS 的损害最小,新节点会不断被移除和替换,直到它再次加入 ACS。因此,(s_1) 大部分时间在 (s) 和 (s - 1) 之间波动。

然而,偶尔会发生移除的节点在图结构中起着关键作用,或者新添加的节点由于其创建的新图结构引发灾难,导致 (s_1) 和链接数量大幅下降。这些灾难及其原因将在下一节讨论。

6. 组织阶段的灾难与恢复

在长时间的运行中,可以观察到 (s_1) 出现多次突然大幅下降的情况,即大量物种灭绝的灾难。有些灾难似乎使系统回到随机阶段,而有些则随后出现恢复,(s_1) 回升到最大值 (s)。恢复过程相对灾难来说较慢,灾难通常在单个时间步内发生。

6.1 节点删除和添加的影响

6.1.1 节点删除

删除一个节点可能会改变主导 ACS 的核心。如在讨论关键节点时所述,移除关键节点会导致主导 ACS 前后的核心重叠为零,这种事件称为核心转移。

在实际运行中,关键节点只有在恰好是具有最小 (X_i) 的节点之一时才会被移除。然而,核心节点通常具有较高的 (X_i) 而受到“保护”。这是因为 (X) 是 (C) 的特征向量,特征值为 (\lambda_1),对于主导 ACS 的节点,(X_i = \frac{1}{\lambda_1} \sum_{j} c_{ij}X_j)。如果节点 (i) 只有一个入边(来自节点 (j)),则 (X_i = \frac{X_j}{\lambda_1}),即 (X_i) 相对于 (X_j) 被“衰减”了一个因子 (\lambda_1)。在 ACS 的外围,大多数节点只有一个入边,因此离核心越远的节点 (X_i) 越低。

当 (\lambda_1 = 1) 时,没有衰减,核心节点和外围节点的 (X_i) 相同。此时,如果核心是一个单循环,每个核心节点都是关键节点,组织容易受到核心转移的影响。

6.1.2 节点添加

我们关注新节点在新吸引子中存活((X_k) 非零)的情况,将这种新节点定义为创新。创新可以根据其图论结构进行分类,形成一个层次结构。

创新分为两类:不影响主导 ACS 核心的创新和影响核心的创新。不影响核心的创新包括随机阶段创新、增量创新和休眠创新;影响核心的创新包括核心增强创新、核心转移创新和首次 ACS 创建创新。

核心转移定理指出,当满足以下条件之一时,包含新物种的最大新不可约子图 (N) 将成为图的新核心,取代旧核心 (Q_{n - 1}):
1. (\lambda_1(N) > \lambda_1(Q’_n));
2. (\lambda_1(N) = \lambda_1(Q’_n)) 且 (N) 在 (Q’_n) 的下游(即从 (Q’_n) 到 (N) 有路径,但从 (N) 到 (Q’_n) 没有路径)。

6.2 灾难、核心转移和近因分类

大多数大规模灭绝事件发生在主导 ACS 结构发生剧烈变化(核心转移)时。例如,在某些运行中,当 (s_1) 下降超过 (s/2) 的 701 个事件中,612 个是核心转移;当 (s_1) 下降超过 90% 的 235 个事件中,226 个是核心转移。

核心转移可以分为三类:
1. 完全崩溃 :图更新前有 ACS,更新后没有,系统进入随机阶段。这种情况通常发生在移除关键节点时,例如当核心是单循环且 (\lambda_1 = 1) 时,核心节点都是关键节点且容易被移除。
2. 核心转变创新的接管 :新的核心转变创新导致核心转移,例如新创建的循环在旧核心下游,使得旧核心灭绝,新循环成为新核心。
3. 休眠创新的接管 :之前创建的休眠创新在旧核心因关键节点移除而被削弱后,成为新核心。在这种情况下,新核心的 (\lambda_1) 低于旧核心,但不为零。

6.3 恢复

完全崩溃后,系统回到随机阶段。在 (O(s)) 次图更新后,每个节点被随机连接的节点替换,图恢复到初始的随机状态。然后,新的 ACS 将在平均时间 (\frac{1}{p^2s}) 内形成,并在额外的 (\frac{1}{p} \ln(s/s_0)) 时间内覆盖整个图,其中 (s_0) 是本轮形成的初始 ACS 的大小(通常为 2)。

其他灾难后,ACS 仍然存在,系统处于增长阶段,立即开始恢复,(s_1) 以时间尺度 (\frac{1}{p}) 呈指数增长。恢复主要是由于创新(主要是类型 2 和 4,以及一些类型 3)的作用。

6.4 扰动的影响分类

根据对 (s_1) 的影响,扰动可以大致分为两类:
1. 建设性扰动 :包括新组织的诞生(类型 6 创新)、新节点连接到核心(类型 4 创新)和新节点连接到主导 ACS 的外围(类型 2 创新)。
2. 破坏性扰动 :包括完全崩溃和休眠创新的接管(由关键节点的损失引起),以及核心转变创新的接管(类型 5 创新)。虽然这些扰动在短期内导致大量物种灭绝,但从长期来看,它们通常会触发新的建设性事件,如增量创新(类型 2)和核心增强创新(类型 4)。

这些扰动中,引入新不可约结构或破坏现有不可约结构的扰动会引起最大的动荡。例如,首次 ACS 的创建触发了增长阶段,核心转变创新的接管和休眠创新的接管以及完全崩溃都导致了系统的重大变化。

7. 结论

本文讨论的动态系统展示了丰富的行为,类似于现实生活中的现象,如组织结构的诞生、合作与竞争的交替、组织的脆弱性和恢复、创新的影响等。

7.1 对生命起源问题的启示

该模型为生命起源问题提供了重要见解:
1. 模型展示了从无到有出现组织的过程,一个小的 ACS 偶然形成,然后触发系统的自组织。
2. 一个高度结构化的组织,其随机形成的时间尺度随系统大小呈指数增长,但在本模型中可以在相对较短的时间内形成,时间仅随系统大小呈对数增长。

此外,该模型的数学思想和机制可能与其他生命起源的方法相关,例如多肽的复杂自催化组织可以与柠檬酸循环共生,膜可以包围复杂分子组织形成“细胞”,分子组织可以为自我复制分子创造有利环境。

7.2 模型的特点和局限性

本模型具有一些简化特征,增强了分析的可处理性。例如,固定图上的种群动态是线性的,方程 (16.1) 虽然是非线性的,但源于线性方程 (16.2),其吸引子可以通过底层线性系统轻松分析,吸引子是图邻接矩阵的佩龙 - 弗罗贝尼乌斯特征向量。

然而,模型也有局限性。例如,种群动态在短时间尺度上是线性的,而在长时间尺度上由于图动态和种群动态的相互作用而具有非线性。未来可以探索短时间种群动态本身就是非线性的模型,以及考虑空间自由度、更真实的新颖性生成机制和内源性时间尺度的模型。

7.3 总结表格

方面 详情
模型核心 图论与自催化网络演化,结合种群动态和图动态
阶段 随机阶段、增长阶段、组织阶段
灾难类型 完全崩溃、核心转变创新接管、休眠创新接管
创新类型 随机阶段创新、增量创新、休眠创新、核心增强创新、核心转移创新、首次 ACS 创建创新
对生命起源启示 展示组织从无到有,结构化组织短时间形成
模型特点 固定图种群动态线性,长时间尺度非线性
未来方向 探索非线性短时间动态、考虑空间自由度等

7.4 整体流程 mermaid 流程图

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([初始随机图]):::startend --> B{有循环?}:::decision
    B -- 否 --> C(随机阶段):::process
    B -- 是 --> D(增长阶段):::process
    C --> D
    D --> E(组织阶段):::process
    E --> F{发生灾难?}:::decision
    F -- 是 --> G{完全崩溃?}:::decision
    G -- 是 --> C
    G -- 否 --> D
    F -- 否 --> E

这个流程图展示了系统从初始随机图开始,经过随机阶段、增长阶段和组织阶段的演化过程。在组织阶段,可能会发生灾难,根据灾难的类型(完全崩溃或其他),系统可能回到随机阶段或继续在增长阶段恢复。整个流程体现了系统的动态演化和自我调节能力。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值