Interactive Paths Embedding for Semantic Proximity Search on Heterogeneous Graphs
此论文和上一篇论文都出自达摩学院,有很大的相似之处。
ABSTRACT
- 引入交互路径的概念,对查询对象和目标对象之间的多条路径之间的相互依赖关系进行建模。
- 提出一个交互式路径嵌入(IPE)模型,该模型学习所得到的交互式路径结构的低维表示,以进行接近度估计。(路径嵌入成向量)
INTRODUCTION

普通的path-based的方法可以找到donna到Emily的三条路径,每一条路径都只能单独的提取到部分语义信息。
在本篇论文中,建立来同时提取建模问询节点和目标节点之间的相互依赖的多条路径。
interactive path:图上彩色的,就是在原path-based的到的路径上层架的边
论文的成果:
- 建立interactive path
- 把interactive-paths structure给embedding
也就是aggregate all the interactive-paths structure embedding output as a single vector
RELATED WORK
略
PROBLEM FORMULATION
- 异构图
- 路径
- interactive-paths structure
问询节点q和目标节点v之间的有向无环图
Problem inputs
- 异构网络G
- training tuples D = {(qk,ak,bk)} :和前篇论文一样,a靠近q
- qv之间的路径P(q,v)
Problem outputs
- qv间多个路径:P(q,v)–>interactive-paths structure: I(v,q)
- qv间每个路径:P(q,v)的向量g(q,v)–>interactive-paths structure的向量o(q, v)
- qv间多种interactive-paths structure的向量o(q, v)–> proximity embedding vector f(q,v)
- 建立qv间的 proximity score (评分)
π \pi π(q,v)= θ T \theta^T θTf(q,v)
此处和前篇一样: θ \theta θ是 proximity estimation参数,需要学习的到;f是向量,也要学习的到
在参数学习中,利用 π \pi π(q,a)> π \pi π(q,b)来学习
INTERACTIVE PATHS CONSTRUCTION
使用cycle-free shuffling mechanism来从qv之间的多条path建立interactive-paths structure
cycle-free shuffling mechanism
cycle-free shuffling mechanism分成两个步骤来建立interactive-paths structure:
- Adding interdependencies:在多条path上添加有向边–依赖,就是上图中彩色的有向边。
- Removing cycles:在添加新边的图上去掉环。
-
Adding interdependencies
方法很简单,就是找到路径上涉及到的点的除了路径上直接相连的,还有其他的可以相连的点,然后一次相连,如下图。
-
Removing cycles
算法很简单,看图+我红笔写的备注就能明白,这样去掉了圈。
通过1,2两部,便建立了INTERACTIVE PATHS CONSTRUCTION
INTERACTIVE PATHS EMBEDDING
使用interactive GRU mechanism来将interactive path sturcture I(q,v)嵌入成向量。
Interactive GRU
基本思路:表达点的向量->表达路径的向量->表达interactive path sturcture的向量
- 表达点的向量:使用前导点来表达当前点,考虑以下方面
- Path heterogeneity:路径多样性,也就是表达这个点的时候,前导点和此点在一个路径上的贡献大,不在一个路径上的贡献小
- Distance awareness:距离考虑,前导点如果距离问询节点近,就对此点有更大的贡献
- Node heterogeneity:点的多样性,使用one-hot来编码点的类型。
建模:建立的网络和LSTM中的门一样,输入IN如下(考虑了Path heterogeneity,Distance awareness,Node heterogeneity,我用红笔解释了)
注意,前面表达式hRj是网络的IN
- 表达path的向量
- 表达interactive path structure的向量
- 表达multiple interactive path structure的向量
- promixity embedding
如下:
其实就是一步步在使用maxpooling
总结:
- 使用前导点的三点考虑+LSTM的门–>节点的向量–>maxpooling成path的向量–>structure的向量–>multiple structure的向量–>最终promixity embedding向量
- 其中的参数:
三点考虑的参数
LSTM参数
END-TO-END TRAINING
和前篇一样:利用
π
\pi
π(q,a)>
π
\pi
π(q,b)来学习
结果:
- 得到每个节点的向量
- 得到路径向量
- 得到struture向量
- 得到proximity score 从而能知道问询节点p和那个目的节点v最相似。
总结
这篇论文我觉得和上一篇差不多,都是在之前path-based的方法的基础上更进一步,考虑到更高层次的结构问题来进行embedding。