【论文笔记】Graph Embedding Techniques, Applications, and Performance: A Survey

该文全面调查了图嵌入技术,包括基于因式分解、随机游走和深度学习的算法,如LLE、DeepWalk、SDNE、GCN等,并分析它们在节点分类、链接预测等任务上的表现。文章还探讨了这些方法的挑战与未来方向,并提供了GEM这一Python库。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://arxiv.org/pdf/1705.02801.pdf
这篇论文列举了目前graph embedding算法,将其分为“因式分解”、“随机游走”、“深度学习”三类,在不同的任务上评估其效果,最后提了点发展方向

前言

  1. 图在生物蛋白质结构、社交网络、词共现网络中应用
  2. 图分析任务可以分为:
    - 节点分类(随机游走、提特征)
    - 链路预测(相似性方法、最大似然法、概率模型)
    - 聚类(基于距离)
    - 可视化
  3. 模型通常作用于:原始图邻接矩阵,或一个生成的向量空间内
  4. 获取结点的向量表达的挑战:
    - 选择一个属性。结点的向量表示应表达图结构或者结点关系
    - 伸缩性。需要适应大型图结构的计算需求
    - embedding的维度。大维度信息更全,小维度关系表达更好
  5. 论文的贡献:
    • 对现有算法分四类,并描述其研究方向和挑战等
    • 系统分析不同算法对应不同问题的效果,测试其效果,综合比较。。。以及鲁棒性、超参等
    • 做了个python包,GEM

定义

  1. 图(Graph):图 G(V,E) G ( V , E ) ;结点 V={ v1,v2,...,vn} V = { v 1 , v 2 , . . . , v n } ;边 E={ eij}ni,j=1 E = { e i j } i , j = 1 n ;邻接矩阵S, sij0 s i j ≥ 0
  2. 第一相似度(First-order proximity): sij s i j vi v i vj v j 的第一相似度
  3. 第二相似度(Second-order proximity): si=[si1,...,sin] s i = [ s i 1 , . . . , s i n ] 表达第一 vi v i 与邻居的相似度集合,第二相似度为 si</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值