LINE

最新推荐文章于 2022-01-28 23:40:31 发布

煎饼证

最新推荐文章于 2022-01-28 23:40:31 发布

阅读量419

点赞数 2

CC 4.0 BY-SA版权

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/jianbinzheng/article/details/81512429

机器学习专栏收录该内容

32 篇文章

订阅专栏

LINE: Large-scale Information Network Embedding

概述

LINE是一种Graph Embedding的方法，在非NN的方法中是比较好的。
LINE的提出：考虑到因式分解的方法只适用于无向图、且只考虑一阶的相似关系；而DeepWalk方法没有明确表现出维持了什么特征。
所以LINE实现了可用于有向无向图、有权无权，以及维持了局部和全局结构(主要是二阶)。另外提出了一种边采样方法。

依据：真是世界的网络中，很多关系是没能被直接观测到的(即一阶相似性first-order)，但他们可以通过邻居实现间接关联的(二阶相似性second-order)

定义

图、点、边——G、V、E，权重用w
一阶相似性，指直接相连的两个点（即边），权重即相似性，不相连则为0；一阶相似性通常表示两个直接关联物体，
二阶相似性，指结点的邻居之间的相似性。 $p_u=(w_{u,1},...,w_{u,|V|})$ 表示结点u与邻居的的一阶相似性，则二阶相似性用 $p_u$ 和 $p_v$ 表示，若u，v没有共同邻居，则二阶相似性为0
LINE(Large-scale Information Network Embedding)

建模

一阶相似性建模
$p1(vi,vj)=11+exp(−u⃗iT⋅u⃗j)p_1(v_i,v_j)=\frac{1}{1+exp(-\vec{u}^T_i \cdot \vec{u}_j)}$
其中
$u⃗i∈Rd\vec{u}_i \in R^d$ 是结点 $v_i$ 的低维向量表示
$p(⋅,⋅)p(\cdot,\cdot)$ 是空间V*V的分布，其经验概率为 $p^1(i,j)=wijW\hat{p}_1(i,j)=\frac{w_{ij}}{W}$ , $W=∑(i,j)∈EwijW=\sum_{(i,j)\in E}w_{ij}$
那么为了保持一阶相似性，则最小化目标函数：
$O1=d(p^1(⋅,⋅),p1(⋅,⋅))O_1=d(\hat{p}_1(\cdot,\cdot),p_1(\cdot,\cdot))$
$d(⋅,⋅)d(\cdot,\cdot)$ 表示两个分布的距离，如KL散度则为
$O1=−∑(i,j)∈Ewijlog⁡p1(vi,vj)O_1=-\sum_{(i,j)\in E}w_{ij} \log p_1(v_i,v_j)$

注意：一阶相似性只适用于无向图

二阶相似性
$p2(vj∣vi)=exp(u⃗k′⋅u⃗i)∑k=1∣V∣exp(u⃗k′⋅u⃗i)p_2(v_j|v_i)=\frac{exp(\vec{u}'_k\cdot \vec{u}_i)}{\sum_{k=1}^{|V|} exp(\vec{u}'_k\cdot \vec{u}_i)}$
其中
$u⃗i′\vec{u}'_i$ 是结点 $v_i$ 的“上下文”（邻居）低维向量表示
同样，使得环境的条件概率分布和经验条件概率近似
$O2=∑i∈Vλid(p^2(⋅∣vi),p2(⋅∣vi))O_2=\sum_{i\in V}\lambda_{i} d(\hat{p}_2(\cdot|v_i),p_2(\cdot|v_i))$
$p^2(⋅∣vi)=wijdi\hat{p}_2(\cdot|v_i)=\frac{w_{ij}}{d_i}$ ，di是结点i的出度， $di=∑k∈N(i)wikd_i=\sum_{k\in N(i)} w_{ik}$
$O2=−∑(i,j)∈Ewijlog⁡p2(vj∣vi)O_2=-\sum_{(i,j)\in E}w_{ij} \log p_2(v_j|v_i)$

以后再补吧。。。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。