用于异质图嵌入的元路径聚合图神经网络
摘要
异质图嵌入是将异质图丰富的结构和语义信息嵌入到低维节点表示中。针对此问题,本文提出了一种新的模型MAGNN。具体来说,MAGNN使用了三个主要组件:
- 用于封装输入节点属性的节点内容转换
- 用于合并中间语义节点的元路径内部聚合
- 用于合并来自多个元路径的消息的元路径间聚合
在三个真实的异质图数据集上进行了大量的节点分类、节点聚类和链路预测实验表明,MAGNN有更准确的预测结果。
1 引言
现有的模型通常是在异质图中定义多个元路径,以捕获复合关系(语义)并指导邻域选择。虽然这些基于元路径的嵌入方法在节点分类和链路预测等各种任务上优于传统的网络嵌入方法,但它们仍然存在以下至少一个限制:
- 忽略节点内容特征,因此很少在具有丰富节点内容特征的异质图上表现良好(e.g.,metapath2vec,ESim,HIN2vec,HERec)。
- 只考虑两个端节点,从而丢弃了元路径上的所有中间节点,从而导致信息丢失(e.g.,HERec,HAN)。
- 只依赖于单个元路径,因此需要人工选择元路径,丢失了来自其他元路径的部分信息,导致性能不佳(e.g.,metapath2vec)。
为了解决以上问题,本文提出了一种新的用于异质图嵌入的元路径聚合图神经网络(MAGNN)。
MAGNN由三个部分组成:
- 节点内容转换
- 元路径内部聚合
- 元路径间的聚合
具体来说,MAGNN首先利用特定类型的线性变换,将不同类型节点的可能不同维度的属性信息投影到相同的潜在向量空间。接下来,对每个元路径应用具有注意力机制的元路径内部聚合。在元路径内部聚合过程中,每个目标节点都会从连接该节点与其基于元路径的邻居的元路径实例中提取和组合信息。通过这种方式,MAGNN从邻居节点和两者之间的元路径上下文中捕获异质图的结构和语义信息。在元内聚合之后,MAGNN进一步利用注意力机制进行元路径间的聚合,将从多条元路径获得的潜在向量融合到最终的节点嵌入中。
贡献:
- 提出了一种新的用于异质图嵌入的元路径聚合图神经网络。
- 设计了几个候选编码器函数,用于从元路径实例中提取信息,其中一个基于复杂空间中的关系旋转思想。
- 在IMDb和DBLP数据集上进行了大量的节点分类和节点聚类的实验,并且在Last.fm数据集上进行了链路预测,以评估提出的模型的性能。实验表明,MAGNN学习到的节点嵌入始终优于其他最先进的 BaseLine 生成的节点嵌入。
2 准备工作
本节给出了与异质图相关的一些重要术语的正式定义。相关定义的图示见图1。

异质图(Heterogeneous Graph):
G = ( V , E ) G=(V,E) G=(V,E),包含节点集 V V V和连接集 E E E。异质图还包含一个节点类型映射函数 ϕ : V → A ϕ:V→A ϕ:V→A和一个连接类型映射函数 ψ : E → R ψ:E→R ψ:E→R。 A A A和 R R R表示预定义的对象类型和连接类型的集合,其中 ∣ A ∣ + ∣ R ∣ > 2 |A|+|R|>2 ∣A∣+∣R∣>2。
元路径(Metapath):
元路径 P P P定义为 A 1 R 1 → A 2 R 2 → . . . R l → A l + 1 \text{ }A_1\text{ }\underrightarrow{R_1}\text{ }A_2\text{ }\underrightarrow{R_2}\text{ }...\text{ }\underrightarrow{R_l}\text{ }A_{l+1} A1 R1 A2 R2 ... Rl Al+1(缩写为 A 1 A 2 ⋅ ⋅ A l + 1 A_1A_2··A_{l+1} A1A2⋅⋅Al+1),它描述了对象 A 1 A_1 A1和 A l + 1 A_{l+1} Al+1之间的复合关系 R = R 1 ◦ R 2 ⋅ ⋅ R l R=R_1◦R_2··R_l R=R1◦R2⋅⋅Rl,其中 ◦ ◦ ◦表示关系上的组合算子。
元路径实例(Metapath Instance):
给定异质图的元路径 P P P, P P P的元路径实例 p p p被定义为图中遵循 P P P定义的模式的节点序列。
基于元路径的邻居(Metapath-based Neighbor):
给定异质图的元路径 P P P,节点 v v v的基于元路径的邻居 N v P N_v^P NvP被定义为通过 P P P的元路径实例与节点 v v v连接的节点集。由两个不同的元路径实例与 v v v相连的同一个邻居节点,被视为 N v P N_v^P NvP中的两个节点。注意,如果 P P P是对称的, N v P N_v^P NvP包括 v v v本身。
例如,考虑到图1中的元路径UATA,艺术家Queen是用户Bob的基于元路径的邻居。 这两个节点通过元路径实例Bob-Beatles-Rock-Queen连接,Beatles和Rock为这个元路径实例的中间节点。
基于元路径的图(Metapath-based Graph):
给定异质图 G G G的元路径 P P P,基于元路径的图 G P G^P GP是由图 G G G中所有基于元路径

本文介绍了一种新的模型MAGNN,针对异质图嵌入问题,通过节点内容转换、元路径内部聚合和元路径间聚合,有效捕捉结构和语义信息。实验结果表明,MAGNN在节点分类、聚类和链路预测任务上表现出色,优于传统方法。
最低0.47元/天 解锁文章
697

被折叠的 条评论
为什么被折叠?



