图上的机器学习系列-聊聊LINE

最新推荐文章于 2022-08-27 16:33:08 发布

原创

最新推荐文章于 2022-08-27 16:33:08 发布 · 935 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#图嵌入 #图神经网络 #图表示 #机器学习

本文探讨了LINE方法在图嵌入中的应用，它通过定义一阶和二阶相似度，利用KL散度作为目标函数进行优化。LINE不仅考虑了相邻节点的连接，还考虑了共同邻居的影响。文章还提到了LINE在优化过程中的技巧，如负采样和别名表概率抽样，以及最终如何合并一阶和二阶向量表示。

前言
本篇继续GraphEmbedding旅途，来聊聊LINE这个方法，对应的paper为《LINE: Large-scale Information Network Embedding》。

---广告时间，欢迎关注本人公众号：

LINE的核心方法
首先，还是先来脑补一下LINE方法的思考过程：

相似度&距离
在上一篇中，我们已经知道DeepWalk是采用类似于Word2Vec的方法，用一个节点的邻居序列来保存节点在网络中的拓扑结构，使得图中距离较近的节点在新的向量空间中也有较近的距离，但确实没有显示化地定义一个距离相似度的目标函数，也不是基于对目标函数的求解来得到向量表达的。LINE方法则明确定义一个量化的相似度计算公式，而且不仅包含一阶相似度，还包括了二阶相似度。

一阶相似度通常就是节点之间直接相连的边，可以用边的权重来度量。二阶相似度其实也容易理解，就是两个节点很可能没有边相连，但它们有很多共同的邻居节点，如下图所示：

事实上，我们回想一下DeepWalk的方法，也可以捕捉到5，6两个节点的邻居相似性对吧？但因为DeepWalk本身没有引入节点之间边的权重，所以较难量

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。