图深度学习(deep learning on graphs)第四章第三部分（4.3）阅读笔记

最新推荐文章于 2022-12-03 19:45:48 发布

原创最新推荐文章于 2022-12-03 19:45:48 发布 · 623 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#图论 #深度学习

图专栏收录该内容

30 篇文章

订阅专栏

本文详细介绍了图嵌入技术在不同类型的图上的应用，包括异质图、二部图、多维图、有符号图和超图以及动态图。异质图嵌入关注不同节点类型的映射，如使用CNN处理图片节点；二部图嵌入挖掘两个节点集合间的关系；多维图嵌入学习节点的通用和特定表示；有符号图嵌入利用结构平衡理论处理正负边；超图嵌入则处理超边及节点共现信息；动态图嵌入捕获时间相关的temporal信息。这些方法通过不同的extractor和reconstructor来重构图结构和关系。

复杂图上的图嵌入

一、异质图嵌入
异质图中存在着不同种类的节点。一个框架HNE用于将异质图中不同种类的节点映射到同一个embedding space中去，对于每一种节点都采用了不同的mapping function。 例如，如果节点是图片，则可以采用CNN作为mapping function。HNE的目标是保存节点间的pairwise连接。因此extractor挖掘节点对之间的边信息，其实就是邻接矩阵A。因此reconstructor的目标就是从节点embedding中还原出邻接矩阵A。给定节点对 $v_i,v_j)$ ，embedding domain中为 $u_i,u_j$ ,重构出邻接元素 $A^i,j=1\hat{A}_{i,j}=1$ 的概率为：

p(A^i,j=1)=σ(uiTuj),p(\hat{A}_{i,j}=1)=\sigma(u_i^T u_j),

σ\sigma

为sigmoid。

p(A^i,j=0)=1−σ(uiTuj),p(\hat{A}_{i,j}=0)=1-\sigma(u_i^T u_j),

objective定义如下：

−∑i,j=1N(Ai,jp(A^i,j=1)+(1−Ai,j)p(A^i,j=0)).-\sum_{i,j=1}^N(A_{i,j}p(\hat{A}_{i,j}=1)+(1-A_{i,j})p(\hat{A}_{i,j}=0)).

在异质图中的节点与边之间存在着不同的语义信息，metapath2vec同时关注节点间的结构信息以及语义信息，它的mapping function与deepwalk一致。

1、基于meta-path的信息extractor
需要同时挖掘结构以及语义信息，extractor为meta-based random walk来挖掘出共现信息。

（1）meta-path schema定义
$A1⟶R1A2⟶R2...⟶RlAl+1A_1 \stackrel{R_1}{\longrightarrow}A_2 \stackrel{R_2}{\longrightarrow}...\stackrel{R_l}{\longrightarrow}A_{l+1}$ , $A_i$ 和 $R_i$ 是属于特定种类的节点和边。meta-path schema的实例是一条meta path，路径上的节点和边遵从schema给定的类型。

（2）meta-path random walk定义 请添加图片描述

2、基于meta-path的信息reconstructor
具有两种reconstructor一种是deepwalk，另外一种是对于每种不同种类的节点定义不同的分布。给定 $v_i$ ,observing $v_j$ 的概率如下：请添加图片描述
二、二部图嵌入
二部图中存在两个不相交的节点集合，边只存在两个集合之间。一个二部图嵌入的方法BiNE被提出用于同时挖掘两个节点集合之间的关系以及每个节点集合内部的关系（就是说需要挖掘的关系为边以及每个集合内部节点间的共现关系）。

1、information extractor
为了挖掘两个node集合内部的共现关系，两个同质图（with $U$ 和 $V$ ）被引入，如果在原来的图中两个节点是2-hop neighbor，它们就会在induced graph中连接，定义两个induced graph为 $G_U,G_V$ ,在 $G_U,G_V$ 中利用deep walk来进行节点共现关系挖掘。最后挖掘出来的信息包括边信息（邻接矩阵）以及上面挖掘出的共现关系。

2、reconstructor and objective
还原两个节点集合内部的节点共现性方法和deep walk的一致，它们的objective被定义为 $L_U,L_V$ ,还原两节点间的边信息定义如下：

p(ui,vj)=σ(uiTvj)p(u_i,v_j)=\sigma(u_i^Tv_j)

,objective为:

LE=−∑(ui,vj)∈Elogp(ui,vj)L_E=-\sum_{(u_i,v_j)\in E}log p(u_i,v_j)

,final objective为：

L=LE+η1LU+η2LV.L=L_E+\eta_1L_U+\eta_2L_V.

三、多维图嵌入
在多维图中，所有维度共享相同的节点，但是每个维度都有自己的图结构。对于每个节点，多维图嵌入的目标是:学习general node representation（从所有维度中挖掘信息）、一个维度的specific representation（只关注相关维度）。实际上，general representation与specific representation并不是独立的。因此建模他们的dependence很重要。对于每个维度d,对于节点 $v_i$ 的dimension-specific representation $u_{d,i}$ 为：

u_{d,i}=u_i+r_{d,i}

其中

u_i

代表了general representation，而

r_{d,i}

代表dimension d representation（不考虑independence）。

1、the mapping function
general representation mapping function： $f ()$
dimension-specific d representation mapping function: $f_d()$

u_i=f(v_i)=e_i^TW,

r_{d,i}=f_d(v_i)=e_i^TW_d.

2、information extractor
所有维度的共现关系挖掘( $I_d为维度d上挖掘出的共现关系$ )

I=∪d=1DId.I=\cup_{d=1}^D I_d.

3、the reconstructor and objective
reconstructor除了需要对每个维度来重构挖掘信息以外，都和deep walk一致。objective如下：
请添加图片描述
四、有符号图嵌入
有符号图中包括正边以及负边。根据结构平衡理论，节点和与通过正边连接的节点更相近（friends），与通过负边连接的节点更远（foes）。方法SiNE保存的信息包括friends与foes之间的相关关系。SiNE中的mapping function与deep walk的一致。

1、information extractor
请添加图片描述

2、reconstructor
econstructor希望还原出三元组。因此基于node embedding，我们有以下：
请添加图片描述
2、the objective

五、超图嵌入
在超图中，一条超边关联了多个节点。DHNE被提出来学习超图上的节点表征（通过使用超边上的关系）。在超边上有两种信息需要进行学习：一种是超边信息，另一种是超边的节点上的共现关系。

1、information extractor
请添加图片描述
所以extractor挖掘出来的信息包括超边集合 $E$ ,以及global共现信息 $A$ 。

2、the mapping function
请添加图片描述
3、reconstructor and objective
reconstructor一方面希望还原超边信息 $E$ ，另一方面则是希望还原超边上节点的共现信息，因此reconstructor和objective也包括两个部分: