【论文笔记】Graph Embedding Techniques, Applications, and Performance: A Survey

最新推荐文章于 2022-03-21 01:18:12 发布

原创

最新推荐文章于 2022-03-21 01:18:12 发布 · 4.4k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

该文全面调查了图嵌入技术，包括基于因式分解、随机游走和深度学习的算法，如LLE、DeepWalk、SDNE、GCN等，并分析它们在节点分类、链接预测等任务上的表现。文章还探讨了这些方法的挑战与未来方向，并提供了GEM这一Python库。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://arxiv.org/pdf/1705.02801.pdf
这篇论文列举了目前graph embedding算法，将其分为“因式分解”、“随机游走”、“深度学习”三类，在不同的任务上评估其效果，最后提了点发展方向

前言

图在生物蛋白质结构、社交网络、词共现网络中应用
图分析任务可以分为：
- 节点分类(随机游走、提特征)
- 链路预测(相似性方法、最大似然法、概率模型)
- 聚类(基于距离)
- 可视化
模型通常作用于：原始图邻接矩阵，或一个生成的向量空间内
获取结点的向量表达的挑战：
- 选择一个属性。结点的向量表示应表达图结构或者结点关系
- 伸缩性。需要适应大型图结构的计算需求
- embedding的维度。大维度信息更全，小维度关系表达更好
论文的贡献：
- 对现有算法分四类，并描述其研究方向和挑战等
- 系统分析不同算法对应不同问题的效果，测试其效果，综合比较。。。以及鲁棒性、超参等
- 做了个python包，GEM

定义

图(Graph)：图 $G(V,E)$ ；结点 $V=\{v_1,v_2,...,v_n\}$ ；边 $E=\{e_{ij}\}_{i,j=1}^n$ ；邻接矩阵S， $s_{ij} \geq 0$
第一相似度(First-order proximity)： $s_{ij}$ 是 $v_i$ 和 $v_j$ 的第一相似度
第二相似度(Second-order proximity)： $s_i=[s_{i1},...,s_{in}]$ 表达第一 $v_i$ 与邻居的相似度集合，第二相似度为 si</

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。