摘要
Kipf提出的GCN模型训练过程同时需要训练数据和测试数据,对于大图训练效率低。为了解决训练过程对测试数据的需要,本文提出了FastGCN模型,将图卷积操作解释为的embedding函数在概率度量下的积分变换。这种解释下,可以采用蒙特卡洛方法估计积分,并可以进行batch训练。FastGCN使用重要采样,在保持准确性的同时训练效率有了数量级的提升。
Model
类比SGD每个epoch随机选取一个样本进行梯度下降。对于图,可以通过丢弃随机样本点iii 的邻居节点,不再使用独立性,计算样本的梯度。$\nabla $
假设有一个无限大的图G′G'G′ 以及节点集合V′V'V