Heterogeneous Graph Neural Network
引言
目前异质图处理的难点在于,一方面要处理图的结构信息,如不同类型的点和边,另一方面要关注每个节点所具有的属性,而目前的工作并没有很好的同时关注这两方面。因此,作者提出了一种异构图神经网络模型HetGNN以解决此问题。
C1:大部分GNN直接聚合邻居节点信息,而远处传过来的节点信息会随着距离而减弱,如何对异质图上的每个节点采样到强相关的邻居节点。
C2:每个节点都带有非结构化的属性特征,如何设计异质图上节点属性的encoder来处理不同节点内容异质性问题。
C3:不同类型的邻居节点对生成节点embedding的贡献也不一样,如何通过考虑不同节点类型的影响来聚合异构邻居的特征信息。
首先,我们设计了一种基于重新启动的随机游动策略,以对HetG中每个节点的固定大小的强相关异构邻居进行采样,并根据节点类型对它们进行分组。 接下来,我们设计了一个具有两个模块的异构图神经网络体系结构,以聚合先前步骤中采样的邻居的特征信息。 第一个模块采用递归神经网络对异构内容的“深度”特征交互进行编码,并获得每个节点的内容嵌入。 第二个模块利用另一个递归神经网络来聚合不同相邻组的内容嵌入,然后通过 attention机制进一步组合这些嵌入,以测量异构节点类型的不同影响并获得最终节点嵌入。
最后,我们利用图上下文损失和小批量梯度下降过程以端到端的方式训练模型。
以概率方式迭代行进到当前节点的邻居或返回到起始节点
将这些采样的节点按照类型分类,
对每个属性分别进行encoding
使用不同的FC层来转换不同的内容特征,然后使用Bi-LSTM捕获“深层”特征交互并累积所有内容特征的表达能力(使用不同的Bi-LSTM来聚合不同类型节点的内容特征,因为它们的内容互不相同),最后利用在所有隐藏状态上的均值池层来获得 v的一般内容嵌入
在多个数据集上进行的广泛实验表明,HetGNN在各种图形挖掘任务(即链接预测,推荐,节点分类和聚类以及归纳节点分类和聚类)中的性能均优于最新基准。