【图结构】之图神经网络GCN详解

最新推荐文章于 2025-04-25 23:00:49 发布

張張張張

最新推荐文章于 2025-04-25 23:00:49 发布

阅读量1.8w

点赞数 75

分类专栏：异构图网络文章标签：图卷积 GCN 异构图

本文链接：https://blog.youkuaiyun.com/qq_41995574/article/details/99712339

版权

作者：張張張張
github地址：https://github.com/zhanghekai
【转载请注明出处，谢谢！】

$G C N$ 源代码地址：https://github.com/tkipf/gcn
$G C N$ 论文地址：https://arxiv.org/pdf/1609.02907.pdf

一、GCN诞生的由来

$\qquad$ $C N N$ 系列： 做图像识别时，对象是图片，是一个二维的结构，于是人们发明了 $C N N$ 这种神奇的模型来提取图片的特征。 $C N N$ 的核心在于它的 $k e r n e l$ ， $k e r n e l$ 是一个个小窗口，在图片上平移，通过卷积的方式来提取特征。这里的关键在于图片结构上的平移不变性： 一个小窗口无论移动到图片的哪一个位置，其内部的结构都是一模一样的，因此是 $C N N$ 可以实现所在。

$\qquad$ $R N N$ 系列: 它的对象是自然语言这样的序列信息，是一个一维的结构， $R N N$ 就是专门针对这些序列的结构而设计的，通过各种"门"的操作，使得序列前后的信息互相影响，从而很好地捕捉序列的特征。

$\qquad$ 上面讲的图片或者语言，都属于欧式空间的数据，因此才有维度的概念，欧式空间的数据的特点就是结构很规则。但是现实生活中，其实有很多很多不规则的数据结构，典型的就是图结构，或称拓扑结构，如社交网络、化学分子结构、知识图谱等等。
$\qquad$ 图的结构一般来说是十分不规则的，可以认为是无限维的一种数据，所以它没有平移不变性。每一个节点的周围结构可能都是独一无二的，这种结构的数据，就让传统的 $C N N$ 、 $R N N$ 瞬间失效。为了处理这类数据，涌现出了许多方法， $G C N$ 只是其中的一种。

$Graph\;Convolutional\;Networks(GCN):$ 图卷积神经网络，实际上跟 $C N N$ 的作用一样，就是一个特征提取器，只不过它的对象是图数据。 $G C N$ 精妙地设计了一种从图数据中提取特征的方法，从而让我们可以使用这些特征去对图数据进行： $节点分类 (n o d e c l a s s i f i c a t i o n)$ 、 $图分类 (g r a p h c l a s s i f i c a t i o n)$ 、 $边预测 (l i n k p r e d i c t i o n)$ ，还可以顺便得到 $图的嵌入表示 (g r a p h e m b e d d i n g)$ 。

二、GCN核心公式

$\qquad$ 假设我们有一批图数据，其中有 $N$ 个节点（node），每个节点都有自己的特征，我们设这些节点的特征组成一个 $N \times d$ 维的矩阵 $X$ ，然后各个节点之间的关系也会形成一个 $N \times N$ 维的矩阵 $A$ ，也称为邻接矩阵（adjacency matrix）。 $X$ 和 $A$ 便是我们模型的输入。

核心公式： $G C N$ 是一个神经网络，它的层与层之间的传播方式是：
$H^{l+1}=\sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})$

其中：

$\tilde{A}=A+I$ 是无向图 $G$ 的邻接矩阵加上自连接(就是每个顶点和自身加一条边)， $I$ 是单位矩阵。

矩阵 $A$ 为什么要加一个单位矩阵呢？
$\qquad$ 只用 $A$ 的话，由于 $A$ 的对角线上都是 $0$ ，所以在和特征矩阵 $H$ 相乘的时候，只会计算这个 $n o d e$ 的所有邻居的特征的加权和，而该 $n o d e$ 自己的特征却被忽略了。因此，我们可以做一个小小的改动，给 $A$ 加上一个单位矩阵 $I$ ，这样就让对角线元素变成 $1$ 了，我们希望在进行信息传播的时候顶点自身的特征信息也得到保留。