精读图神经网络node2vec:scalable feature learning for networks论文
node2vec:scalable feature learning for networks
node2vec:大规模网络节点的表征学习
论文结构
**摘要:**介绍背景及提出node2vec模型,灵活可调的搜索策略
- INTRODUCTION
2. RELATED WORK
3. FEATURE LEARNING
4. SEARCH STRATEGIES
5. Node2vec
6. effectiveness
7. experiments
8. discussion**
学习目标
**1.node2vec算法:**对比bfs,dfs,biased random walk,alias sampling,算法时间复杂度分析
**2. learning framework:**wod2vec,损失函数
**3. 图算法:**常用数据集,框架
**4. 实验:**谱分解,实验设计,参数设置
精读论文
第一部分:论文导读
1. 论文研究背景,成果及意义
图是描述复杂数据的模型(任意的节点数量、复杂的关系)vs图片(CNN)、文本结构(word2vec)
数据源:SNAP,网络数据集,针对社交网络领域
http://snap.stanford.edu/
研究涵盖:节点分类node classification;边预测(link prediction);社群检测(community detection);网络营销(viral marketing);网络相似度(network similarity)
论文的意义
- 论文算法模型总览
- 论文算法模型的细节一二三四五
- 实验设置和结果分析
- 论文总结
- 本课回顾及下节预告
1.论文算法模型总览
特征工程与网络拓扑结构融为一体
论文摘要
摘要核心:1.通过biased random walk算法提出可调的搜索策略,生成不同的节点序列信息
2. node2vec算法在多个领域的网络数据集上达到SOTA.
图的特征工程
什么是图的特征工程?比如用连接表来表示点之间的关系。
Degree:每个节点有几个邻居,那么Degree就是多少。如果是有向图,那么分In和Out
Betweeness:桥梁作用
Closeness:到图上任意一个点的距离
pagerank:点的重要性
图的构建
随机游走算法Random walk
1.传统的random walk 不具备探索节点不同类型领域的能力,认为网络同时具备结构和同质相似性
BFS 和DFS
Node2vec结构
p代表return parameter,是否会回溯节点t;
q代表in out parameter,q>1,局部特征