《Graph Representation Learning》笔记 Chapter6

最新推荐文章于 2025-08-18 18:15:00 发布

原创最新推荐文章于 2025-08-18 18:15:00 发布 · 621 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #图论 #图计算 #图嵌入 #神经网络

图表示学习专栏收录该内容

7 篇文章

订阅专栏

这篇博客探讨了《Graph Representation Learning》中关于图神经网络（GNN）在节点分类和图分类任务的应用。对于节点分类，利用softmax和负对数概率定义损失函数；对于图分类，采用平方误差损失。此外，预训练GNN通过最大化节点和图嵌入间的互信息来优化。博客还讨论了效率问题、节点采样、图级实现、下采样、小批量处理、参数共享和正则化等关键主题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

系列文章
《Graph Representation Learning》笔记 Chapter2
《Graph Representation Learning》笔记 Chapter3
《Graph Representation Learning》笔记 Chapter4
《Graph Representation Learning》笔记 Chapter5

Applications and Loss Functions

GNNs for Node Classification

可以使用 softmax 分类函数和负对数概率来定义损失
$\sum_{u ∈ \mathcal{V}_{train}} -log(softmax(z_u, y_u)) \\ softmax(z_u, y_u) = \sum_{i=1}^c y_u[i] \frac{e^{z_u^Tw_i}}{\sum_{j=1}^c e^{z_u^Tw_j}}$
其中， $c$ 为种类数， $y_u ∈ \mathbb{Z}^c$ 为 one-hot 向量， $w_i ∈ \mathbb{R}^d, i = 1, ..., c$ 为可训练的参数。

GNNs for Graph Classification

平方误差损失如下所示
$\sum_{\mathcal{G}_i ∈ \tau} \| MLP(z_{\mathcal{G}_i}) - y_{\mathcal{G}_i} \|_2^2$
其中， $\tau = {\mathcal{G}_1, ..., \mathcal{G}_n}$ 表示有标签的训练集， $M L P$ 为具有单变量输出的神经网络， $y_{\mathcal{G}_i} ∈ \mathbb{R}$ 为 $\mathcal{G}_i$ 的标签。

Pre-training GNNs

有人提出预训练需要最大化节点嵌入 $z_u$ 和图嵌入 $z_{\mathcal{G}}$ 之间的互信息，损失函数如下所示
$-\sum_{u ∈ \mathcal{V}_{train}} \mathbb{E}_{\mathcal{G}} log(D(z_u, z_{\mathcal{G}})) + \gamma \mathbb{E}_{\widetilde{\mathcal{G}}} log(1-D(\widetilde{z}_u, z_{\mathcal{G}}))$
其中， $z_u$ 为节点 $u$ 基于真实图 $\mathcal{G}$ 生成的嵌入， $\widetilde{z}_u$ 为节点 $u$ 基于 corrupted 版本的图 $\widetilde{G}$ 生成的嵌入， corrupted 指改变节点特征和邻接矩阵， $D$ 表示一个辨别函数，来辨别节点嵌入是否属于 $\mathcal{G}$ 或 $\widetilde{\mathcal{G}}$ 。直观来看， GNN 需要在预训练中学会区分节点属于真图还是假图。