图算法
图游走类算法

NLP领域: Word2vec
参考文章: 《Word2vec: Distributed Representations of Words and Phrases and their Compositionality》
图游走类模型最开始参考的就是 NLP 领域中的 Word2vec 模型。

词的语义由其上下文决定。
Skip Gram:根据中心词预测上下文

Negative Sampling
假设,给定中心词 orange,我们要预测其上下文词中的 juice。

计算词表内所有单词的概率 -> 计算量大
由于负样本的数量一般远远大于正样本的数量,这里对负样本进行采样,以达到类别平衡,并减少计算量。只对正样本和选取的负样本进行分类,从而减少计算量:


图嵌入领域

通常,图中的节点会受其邻居的影响。
图游走类模型——DeepWalk
参考文章:《DeepWalk: Online Learning of Social Representations》
将 NLP 领域的思想运用到图(网络)嵌入领域。

游走方式:Random Walk


整体架构:

node2vec: 对 DeepWalk 的改进
参考文章:《node2vec: Scalable Feature Learning for Networks 》

- bias random walk



整体架构:

异构体随机游走

metapath2vec
参考文章:《metapath2vec: Scalable Representation Learning for Heterogeneous Networks》
异构体定义:
节点和边有不同类型

元路径:meta path

基于meta path 的随机游走


整体框架:


变种:multi-metapath2vec++

变种:side info+multi-metapath2vec++

总结

参考
-
斯坦福CS224W课程: http://cs224w.stanford.edu

被折叠的 条评论
为什么被折叠?



