Graph Embedding——(2)LINE理论

埘间海洋

已于 2022-01-29 00:01:17 修改

阅读量743

点赞数

分类专栏： GNN 文章标签：图论深度优先算法深度学习

于 2022-01-28 23:40:31 首次发布

本文链接：https://blog.youkuaiyun.com/qq_43760191/article/details/122738144

版权

GNN 专栏收录该内容

9 篇文章

订阅专栏

LINE理论

1)介绍

LINE也是一种基于邻域相似假设的方法，只不过与DeepWalk使用DFS构造邻域不同的是，LINE可以看作是一种使用BFS构造邻域的算法。此外，LINE还可以应用在带权图中(DeepWalk仅能用于无权图)。

在这里插入图片描述

LINE在图上定义了两种相似度：一阶相似度与二阶相似度。

一阶相似度：用于描述图中成对顶点之间的局部相似度。形式化描述为若 $\bf u,v$ 之间存在直连边，则边权 $w_{\bf uv}$ 即为两个顶点的相似度；若不存在直连边，则一阶相似度为0。如上图中的6、7两个结点就拥有很高的一阶相似度。

二阶相似度：所比较的是两个结点邻居的相似程度。若 $\bf u,v$ 之间拥有相同的邻居，他们也更加的相似；若不存在相同的邻居顶点，则2阶相似度为0。例如下图中的5、6两点拥有很高的二阶相似度。用一句俗话来概括就是“我朋友的朋友也可能是我的朋友”

2)优化目标

一阶相似度

一阶相似度只能用于无向图当中。

对于每一条无向边 $(i, j)$ ，定义经验分布(两个结点实际的一阶相似度):
$\hat{p_1}(v_i,v_j)=\frac{w_{ij}}{W},W=\sum_{(i,j)\in E} w_{ij}$
定义顶点 $v_i$ 和 $v_j$ 之间的联合概率(两个结点embedding之间的相似度):
$p_1(v_i,v_j)=\frac{1}{1+exp(-\overrightarrow{u}^T_i \cdot \overrightarrow{u}_j)}$
优化目标为最小化：
$O_1=d(\hat{p}_1(\cdot,\cdot),p_1(\cdot,\cdot))$
$d(\cdot,\cdot)$ 是两个分布的距离，常用的衡量两个概率分布差异的指标为KL散度:
$\begin{aligned} D_{KL}(\hat{p}_1||p_1)&= \sum_{(i,j)\in E}\hat{p}_1(v_i,v_j) \log(\frac{\hat{p}_1(v_i,v_j)}{p_1(v_i,v_j)})\\ &=\cdots \\ &=\sum_{(i,j)\in E}\hat{p}_1(v_i,v_j)\log{\hat{p}_1(v_i,v_j)}-\sum_{(i,j)\in E}\hat{p}_1(v_i,v_j)\log{p_1(v_i,v_j)} \end{aligned}$
$\sum_{(i,j)\in E}\hat{p}_1(v_i,v_j)\log{\hat{p}_1(v_i,v_j)}$ 已知，为常数项，求最小值时可忽视，有：
$O_1=-\sum_{(i,j)\in E}w_{ij}\log{p_1(\cdot,\cdot)}$

二阶相似度

这里对于每个顶点 $i$ 维护两个embedding向量，一个是该顶点本身的表示向量 $\overrightarrow{u}_i$ ，一个是该点作为其他顶点的上下文顶点时的表示向量 $\overrightarrow{u}^\prime_i$ 。

对于有向边 $(i, j)$ ，定义给定顶点 $v_i$ 条件下，经验分布定义(两个结点实际的二阶相似度)：
$\hat{p_2}(v_j|v_i)=\frac{w_{ij}}{d_i}$
其中， $w_(ij)$ 是边 $(i, j)$ 的边权 $,$ $d_i$ 是顶点 $v_i$ 的出度,对于带权图， $d_i=\sum_{k\in N(i)} W_{ik}$

产生上下文(邻居)顶点 $v_j$ 的概率(两个结点embedding的相似度)：
$p_2(v_j|v_i)=\frac{exp(\overrightarrow{u}^{\prime T}_j \cdot \overrightarrow{u}_i)}{\sum^{|V|}_{k=1} exp(\overrightarrow{u}^{\prime T}_k \cdot \overrightarrow{u}_i)}$
其中， $∣ V ∣$ 为上下文顶点的个数。

优化目标为最小化：
$O_2=\sum_{i\in V}\lambda_i d(\hat{p}_2(\cdot|v_i),p_2(\cdot|v_i))$
其中， $\lambda_i$ 为控制节点重要性的因子，可以通过顶点的度数或者PageRank等方法估计得到。

使用KL散度并设 $\lambda_i=d_i$ ，忽略常数项，有：
$O_2=-\sum_{(i,j)\in E}w_{ij}\log{p_1(v_j|v_i)}$
最终要获得同时包含有一阶相似度和二阶相似度的embedding，只需要将通过一阶相似度获得的embedding与通过二阶相似度获得的embedding拼接即可。