Cluster—GCN论文提出的主要出发点是现有的图神经网络在图的规模不是特别大的时候能够被广泛的应用在图节点和边的预测任务中,现有的SGD图神经网络仍能够获得不错的结果,但在随着图规模的增大和图神经网络层数的增加,现有的训练方式所需要的内存空间是远不能够被满足的,同时虽然有论文提出了可以不将整个图的信息和每一层每个节点潜入到GPU内存的方法,但这些方法的效果却不尽人意,在预警精度的偏差上和内存使用率的变化上并没有产生有效的变化。
Cluster_GCN所使用的办法是将超大图通过图聚类算法划分成若干个簇,在训练时通过每次都随机选择若干个簇进行结合从而构成一个子图来对其进行小规模训练。Cluster_GCN的特点之一是因为将超大图通过图节点聚类算法划分成了若干个簇,因此导致簇内的边数量是远远大于簇之间边的数量的。通过是因为在训练时使用的是若干个簇组成的小图,所以可以通过神经网络层数的加深来适当的弥补小图训练所带来的预测精度下降效果。