【知识图谱系列】GCNII模型探索DeepGNN的Over-Smoothing问题

GCNII解决Over-Smoothing问题

最新推荐文章于 2024-09-06 19:13:04 发布

原创最新推荐文章于 2024-09-06 19:13:04 发布 · 719 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#知识图谱 #DeepGNN #Over-Smoothing #GCNII #深度图神经网络

知识图谱专栏收录该内容

21 篇文章

订阅专栏

作者：CHEONG

公众号：AI机器学习与知识图谱

研究方向：自然语言处理与知识图谱

GCNII (ICML 2020) 分享，GCNII全称：Graph Convolutional Networks via Initial residual and Identity Mapping

GCNII汇报ppt版可通过关注公众号【AI机器学习与知识图谱】，回复关键词：GCNII 来获得，供学习者使用！可添加微信号【17865190919】进学习交流群，加好友时备注来自优快云。原创不易，转载请告知并注明出处！

一、Motivation

在计算机视觉中，模型CNN随着其层次加深可以学习到更深层次的特征信息，叠加64层或128层是十分正常的现象，且能较浅层取得更优的效果。

图卷积神经网络GCNs是一种针对图结构数据的深度学习方法，但目前大多数的GCN模型都是浅层的，如GCN，GAT模型都是在2层时取得最优效果，随着加深模型效果就会大幅度下降，经研究GCN随着模型层次加深会出现Over-Smoothing问题，Over-Smoothing既相邻的节点随着网络变深就会越来越相似，最后学习到的nodeembedding便无法区分。

上图中，随着模型层次加深，在Cora数据上Test Accuracy逐渐向下降，Quantitative Metric for Smoothness给Over-smoothness提出一个定量的指标 $SVM_G$ ，如下公式所示：

$SVM_G$ 衡量了图中任意两个节点之间的欧氏距离之和， $SVM_G$ 越小表示图学习时Over-Smoothing越严重当，当 $SVM_G=0$ 时，图中所有节点完全相同，也可以从图中看出随着层次的加深， $SVM_G$ 的值越来越小。

二、Method

GCNII为了解决GCN在深层时出现的Over-Smoothing问题，提出了Initial Residual和Identit Mapping两个简单技巧，成功解决了GCN深层时的Over-Smoothing问题。

1、Initial residual

残差一直是解决Over-Smoothing的最常用的技巧之一，传统GCN加residualconnection用公式表示为：

GCNII Initial Residual不是从前一层获取信息，而是从初始层进行残差连接，并且设置了获取的权重。这里初始层initial representation不是原始输入feature，而是由输入feature经过线性变换后得到，如下公式所示：

但Initial Residual不是GCNII首次提出，而是ICLR 2019模型APPNP中提出。

2、Identity Mapping

仅仅使用残差只能缓解Over-Smoothing问题，因此GCNII借鉴了ResNet的思想有了Identity Mapping，Initial Residual的想法是在当前层representation和初始层representation之间进行权重选择，而Identity Mapping是在参数W和单位矩阵I之间设置权重选择，如下公式所示：

从上面公式看出，前半部分是Initialresidual，后半部分是IdentityMapping，其中α和β是超参,GCNII论文中也给出了为什么IdentityMapping可以起到缓解DeepGNN出现Over-Smoothing问题，总结来说：IdentityMapping可以起到加快模型的收敛速度，减少有效信息的损失。