前言
本篇继续Graph Embedding这个话题。我们以前已经聊过DeepWalk、Node2Vec、LINE、GraphSAGE(详见公众号历史文章),它们都是面对的同质图问题,而今天将讨论的MetaPath2Vec则是要回答**如何对于异质图也能进行低维的空间向量表示**。
结合的论文为《metapath2vec: Scalable Representation Learning for Heterogeneous Networks》,作者提出了两个框架模型:metapath2vec、metapath2vec++。
---广告时间,欢迎关注本人公众号
算法原理消化
问题定义
以往我们提到图嵌入,目标会表述成将节点进行向量化表达,并且能保持了节点之间的相似性,即在图上距离较近的节点,在新的向量空间中,也具有较近的距离。但本文除了要保持这个网络结构的特征之外,还提到了semantic relations,这一点在类似DeepWalk的方法中是未曾见过的。
解题思路
当我们面临一个新的问题时,一种有效的思路往往是先思考一下有没有处理过相似的问题,然后将其中使用的方法进行迁移改造以适配新的问题。猜想本文的作者也是类似这样来思考的。我们回顾一下DeepWalk与Node2Vec,它们虽然采用了不同的方法来生成节点序列,但都是为了将数据预处理成Word2Vec可以使用的格式,然后再直接利用SkipGram解决问题,而SkipGram