摘要
传统的图卷积网络关注于如何高效的探索不同阶跳数(hops)的邻居节点的信息。但是目前的基于GCN的图网络模型都是构建在固定邻接矩阵上的即实际图的一个拓扑视角。当数据包含噪声或者图不完备时,这种方式会限制模型的表达能力。由于数据的测量或者收集会不可避免的会出现错误,因此基于固定结构的图模型表达能力是不充分的。本文提出了基于注意力机制的多视图图卷积网络,将拓扑结构的多个视图和基于注意力的特征聚合策略引入到图卷积中。MAGCN输入多个可靠的拓扑结构,这些结构一般是对应任务给定的结构或者使用经典图构造方法生成的。这样做更有可能为下游任务生成好的表示。
引言
图神经网络尤其是GCN在图数据上取得了很好的效果但是几乎所有的这些方法都是基于预先给定的一个固定的邻接矩阵的,即一个单一视角的图拓扑结构。由于邻接矩阵和理想的关系矩阵之间存在差异,基于单视图的图模型的表达能力受到限制。举个栗子,在Cora数据集中,节点表示表示文章或者文档,节点之间的边是文章之间的实际引用关系。然而很多情况下,两篇论文a和b可能涉及完全不同的主题,但因为论文a中开发的算法在b中用于特殊应用而产生了引用关系。但是论文a和论文b的关键词属性特征完全不同。如果仅根据这种引用关系(跨类连边)构造的拓扑结构进行邻域特征聚合,会导致两个类别不同的节点特征互相融合,从而导致误分类。这意味着除了给定的邻接矩阵外(基于引用关系),还可能有其他的视角可以更好的表示节点之间的关系,比如论文的关键词属性特征的相似