GL2vec:基于线图的图嵌入增强方法
1. 引言
图是表示复杂对象的强大工具,广泛应用于社交网络分析和化学信息学等多个领域。为了将图数据应用于现有的机器学习算法,将图表示为数值特征向量(即图嵌入)的问题受到了广泛关注。受自然语言处理中Word2vec和Doc2vec等嵌入技术成功的启发,许多基于语言模型的图嵌入算法被提出。例如,Node2vec可学习节点的嵌入,用于节点分类、节点聚类和链接预测等。
而Graph2vec则与众不同,它能无监督地学习整个图的嵌入,可应用于图分类和图聚类。然而,Graph2vec存在两个局限性:一是无法处理边标签;二是在量化子图时,会将节点标签信息和结构信息捆绑在一起,导致得到的子图ID不一定能保留足够的结构信息来评估图之间的结构相似性。
为克服这些局限性,我们提出了GL2vec方法。该方法利用图的线图(边到顶点的对偶图),通过构造线图的嵌入来补充Graph2vec缺失的边标签信息或结构信息,并将线图的嵌入与原图的嵌入拼接,从而提高图分类任务的性能。
2. Graph2vec
2.1 根小子图的提取
给定一组图 ${G_1, G_2, …, G_N}$ 和一个确定嵌入维度的正整数 $d$,Graph2vec学习一个映射,将图映射到一组 $d$ 维向量 ${f(G_1), f(G_2), …, f(G_N)}$。Graph2vec假设图具有节点标签,一个带节点标签的图 $G$ 表示为 $G = {V, E, k}$,其中 $V$ 是节点集,$E \subseteq (V \times V)$ 是边集,$k: V \to L$ 是为每个节点 $v \in V$ 分配唯一标签的函数。 </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



