1 摘要
在大图中,低维的节点表示在很多预测任务中都很有用,比如内容推荐和确定蛋白质的功能。但是,在训练嵌入时,现有的方法需要所有的节点都参与(也即现有的方法都是直推式的),不能很好地繁华到不可见的节点上。本文提出GraphSAGE,利用节点的特征信息(如文本属性)来有效地为不可见的节点生成嵌入。不是直接为每个节点训练唯一的嵌入,而是学习一个函数通过采样和聚合节点的邻居特征来产生节点的特征。
简介
节点嵌入方法的基本思想是利用降维技术从节点的邻居的高维信息中提取出一个稠密向量。这些节点嵌入可以作为下游任务的输入。以前的工作关注于嵌入单个固定的图中的节点,而很多实际应用需要很快地为不可见的节点甚至完全新的图生成嵌入。这种推断式的能力对于演化图或者不断遇到不可见节点的应用来说非常重要。推断式生成节点嵌入的方法还能促进跨图的泛化,比如,我们可以训练一个典型的有机体的PPI交互网络嵌入生成器,然后利用训练好的模型为新的有机体中的数据产生节点嵌入。
推断式的节点嵌入问题比直推式的要困难,因为泛化到不可见的节点时需要将新观察到的子图与算法已经优化的节点嵌入进行‘对齐’,推断式的框架必须能识别节点邻居的结构特征。
提出的方法:提出了推断式嵌入的一般框架GraphSAGE.不同于基于矩阵分解的方法,此方法利用节点特征(如文本属性,节点配置信息,节点的度)来学习一个嵌入方程以得出不可见节点的嵌入。通过将节点特征融入到学习算法中,我们可以同时学习节点邻居的拓扑结构和节点特征的分布。尽管本方法主要关注于特征丰富的图,但由于会利用节点的度等结构特征,所以本算法也适用于没有节点特征的图。
本算法不是直接为每个节点训练一个特定的嵌入,而是训练一组聚合函数从节点的局部邻居中聚合特征信息。如图1所示

每个聚合函数聚合来自于不同跳或者不同深度的邻居的信息。在测试或推理的时候,训练好的系统利用学习到

提出GraphSAGE方法,通过学习聚合函数,从节点局部邻居中生成不可见节点的嵌入,适用于演化图及新图的节点嵌入生成。与直推式方法不同,GraphSAGE在无监督情况下亦能训练,通过邻居采样和聚合提高模型泛化能力。
最低0.47元/天 解锁文章
935

被折叠的 条评论
为什么被折叠?



