【图神经网络：原理与实战】 1 图与矩阵表示

原创已于 2025-11-19 15:10:04 修改 · 1.7k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #人工智能 #机器学习

于 2025-11-12 00:14:57 首次发布

第七章图对比学习（Graph Contrastive Learning）

1 图与矩阵表示

本章从严格的数学角度给出图的标准符号、矩阵表示及其基本性质。以无向带权图为主，必要时推广到有向图。所有推导以清晰的符号约定开始，随后逐步证明拉普拉斯与归一化算子的代数与谱性质，并把顶点属性（特征）矩阵与上述算子联系起来，形成图上信号处理与能量函数的数学基础。

1.1 基本概念与符号约定

下面给出常用图对象的严格定义与代数表示。

1.1.1 无向图、有向图、带权图

1.1.2 节点、边、子图、路径、度与邻接关系

1.1.3 邻接矩阵、拉普拉斯矩阵与归一化形式

。

1.1.4 属性矩阵与特征向量表示

图滤波与谱域表示

特征平滑与正则化视角

小结（本节要点）

1.2 图的代数性质

图的代数结构由其拉普拉斯算子及相应的谱分析所刻画。该结构建立在线性代数与泛函分析的基础上，通过对拉普拉斯矩阵特征分解、谱域滤波与图傅里叶变换等关键工具的构造，使图信号处理具备与欧式域信号处理一致的形式体系。本节从拉普拉斯矩阵的谱分解入手，系统给出图傅里叶基的定义、谱域卷积结构，并进一步讨论图谱对称性与不变性性质。

1.2.1 拉普拉斯谱分解与特征向量

（一）拉普拉斯矩阵的对称性与半正定性

（二）谱分解定理

（三）特征值的结构与连通性

1.2.2 谱域滤波与频谱解释

1.2.3 图傅里叶变换与卷积定义

（一）图傅里叶变换

（二）图卷积定义

（三）局部化性质

1.2.4 图谱不变性与对称性分析

（一）节点重标记不变性

（二）同构图谱一致性

（三）特征向量的多重性与任意性

小结

通过拉普拉斯矩阵的谱分解，可将图信号分析转化为频域推演，构建图傅里叶变换、谱域滤波与卷积定义。谱分析揭示了图结构与信号变化之间的内在联系，为图神经网络构造卷积算子提供理论基础，并保证模型对节点置换与图同构的结构不变性。本节所述图代数性质构成后续图神经网络设计与分析的核心理论框架。

1.3 图的概率模型与随机过程

图的概率模型与基于随机过程的分析为图结构的统计性质、网络动力学与节点相似性提供统一的工具。以离散时间随机游走与马尔可夫链为中心，先严格构造其代数描述与收敛性质，再引入几个经典的随机图生成模型（Erdős–Rényi、Barabási–Albert、Watts–Strogatz），推导其主要统计量，随后给出稳态分布、吸收概率与与之等价的线性方程组解法，最后由随机过程引出若干结构相似性度量（遍历时间、通勤时间、电阻距离、Personalized PageRank、热核），并把这些量与拉普拉斯算子或转移算子的矩阵解析联系起来。所有命题均按步骤证明或严格推导，便于教材直接使用。

1.3.1 随机游走与马尔可夫链

谱分解与收敛

1.3.2 图生成模型与随机图谱模型（ER、BA、WS）

图生成模型旨在刻画不同网络在统计意义下的典型结构。以下给出三类经典模型的构造与主要性质的严格推导。

1.3.3 图的稳态分布与吸收概率

本节把马尔可夫链的稳态与吸收问题措辞为线性代数问题，给出封闭形式解并证明常用关系。

该解析方法在问题如“到达特定节点的吸收概率”“随机游走染色”“基于吸收的近似距离”等场景中广泛使用。

1.3.4 基于随机过程的结构相似性度量

随机过程产生的一类自然图结构相似性度量包括访问频次、到达时间、通勤时间（commute time）、电阻距离（effective resistance）、个人化 PageRank（Personalized PageRank，PPR）与热核（heat kernel）等。以下逐一定义并给出与矩阵分析的严格联系。

命中时间与通勤时间

电阻距离与拉普拉斯广义逆

Personalized PageRank 与 Katz 指数

热核（Heat Kernel）

小结

1.4 常用评价指标的理论推导与证明

本章作为教材性质的正式章节，系统地、逐步地对图学习中常用评价指标（节点/图分类、链路预测、排序检索、生成任务）及若干统计检验与分布比较度量给出严格的数学定义、推导与证明。每一处推导均给出必要的理论依据与假设条件，便于读者在教学与科研中直接采用本章作为原理说明与数理证明参考。

1.4.1 节点/图分类指标的定义与性质

准确率 (Accuracy) 的定义与界

精确率、召回率与 F1 的定义及关系

推导（F1 为调和平均的最小二乘与极值性质）：

多分类的 macro-F1 与 micro-F1 的定义及等价条件

ROC 与 AUC：定义、积分表示及与 Mann–Whitney U 的等价性证明

1.4.2 链路预测与排序检索指标的严格推导

Mean Reciprocal Rank (MRR) 的定义与性质

Hits@K（Recall@K 在单正例情形）的定义与等价性

NDCG（归一化折损累积增益）的推导与性质

1.4.3 生成任务评价（validity、novelty、uniqueness）与分布比较度量的数理细节

Validity、Novelty、Uniqueness 的概率模型与置信区间

多样性（Diversity）度量：MMD 的定义、无偏估计与渐近性质

Wasserstein 距离的 Kantorovich 双重性与一维闭式解

1.4.4 链路预测中的负样本采样与 filtered 评测的数学说明

链路预测中常需构造负样本集合 E−\mathcal{E}^-E−。负样本的采样策略会影响指标估计的偏差与方差。以下给出常见策略及其数学影响。

负样本采样策略

随机均匀采样：从不在正集中且满足节点对约束的候选边中均匀抽取。数学上使负样本与正样本在“难度”上存在差异，从而可能使 AUC 等指标偏高。
按度分布采样：依据节点度分布加权抽样，旨在模拟真实图中高/低度节点之间边的分布，较能反映真实任务中的难度。
Hard negative（困难负样本）：选择与正样本在结构或属性上相似的负样本，会增加评测难度并更能体现模型区分能力。

Filtered 与 Raw 评测的定义

在知识图谱补全任务中，若在候选排序集合中含有在训练/验证/测试集中出现过的三元组（但对当前查询为非目标三元组），则在原始（raw）评测中这些已知三元组会被视为负例，导致模型可能因“知识泄露”得到不公平提高。Filtered 评测将这些已知三元组从候选集中移除，定义为从候选集合中剔除训练/验证/测试集中出现的任何正确三元组。Filtered 评测数学上减少了对评测值的偏差，从而更公平地反映模型对“未知”事实的补全能力。实验报告应明确采用哪种评测。

1.4.5 统计显著性检验与置信区间：分类与排序指标的变异性评估

为保证比较的严谨性，针对不同类型指标给出合适的统计检验方法与其数学基础。

对分类准确率的 McNemar 检验（配对二项检验）

排序指标（MRR/Hits@K）上的 Bootstrap 方法

显著性检验的多重比较校正

1.4.6 实验报告的量化规范与可复现性数学要点

1.4.7 小结：数学原则性归纳

本章的主要数学结论可以归纳为若干指导性原则：

指标的选择应基于任务的统计特性（类别不均衡、是否存在多相关项、是否关注首位准确性等）。指标的数学定义决定了其对错误类型的敏感性。
为保证评测结果的可复现性与统计显著性，应在报告中给出均值与不确定性估计（方差、置信区间），并在比较时采用适当的统计检验（McNemar、Bootstrap 等）。
对于生成任务，推荐使用既能反映合法性（Validity）和新颖性（Novelty）的统计指标，又能通过分布距离（MMD、Wasserstein）衡量结构统计量的一致性；这些距离度量在理论上具有良好的渐近性质与可测性。
负样本构造、filtered 评测与样本划分等细节会对指标产生系统性偏差，实验协议中必须明确这些操作并在论文中报告。

该章节已涵盖常用评价指标的严格定义、性质证明、估计方法与置信区间、以及分布比较的数学推导。若需要，本章可继续扩展为（1）对 AUC/PR 曲线的数值计算方法与微分性质推导；（2）对 MMD 的核选取和核参数敏感性分析；（3）基于生成模型输出的下游任务评测（例如对分子生成的活性预测的理论框架）；或（4）将上述指标整理为插表与可直接纳入教材的习题与推导练习题。你希望我按哪一方向继续扩展？