图计算论文笔记--Interactive Paths Embedding for Semantic Proximity Search on Heterogeneous Graphs

本文介绍了一种新的模型——交互式路径嵌入(IPE),它能够处理异构图中查询对象与目标对象间的多条路径的相互依赖关系,通过将这些路径结构嵌入到低维向量空间中,实现语义接近度的估计。该模型首先构建交互路径结构,再通过交互式GRU机制将其转换为向量,最后通过端到端训练得到接近度评分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此论文和上一篇论文都出自达摩学院,有很大的相似之处。

ABSTRACT

  • 引入交互路径的概念,对查询对象和目标对象之间的多条路径之间的相互依赖关系进行建模。
  • 提出一个交互式路径嵌入(IPE)模型,该模型学习所得到的交互式路径结构的低维表示,以进行接近度估计。(路径嵌入成向量)

INTRODUCTION

普通的path-based的方法可以找到donna到Emily的三条路径,每一条路径都只能单独的提取到部分语义信息。
在本篇论文中,建立来同时提取建模问询节点和目标节点之间的相互依赖的多条路径。

interactive path:图上彩色的,就是在原path-based的到的路径上层架的边

论文的成果:

  • 建立interactive path
  • 把interactive-paths structure给embedding
    也就是aggregate all the interactive-paths structure embedding output as a single vector

RELATED WORK

PROBLEM FORMULATION

  • 异构图
  • 路径
  • interactive-paths structure

    问询节点q和目标节点v之间的有向无环图

Problem inputs

  • 异构网络G
  • training tuples D = {(qk,ak,bk)} :和前篇论文一样,a靠近q
  • qv之间的路径P(q,v)

Problem outputs

  • qv间多个路径:P(q,v)–>interactive-paths structure: I(v,q)
  • qv间每个路径:P(q,v)的向量g(q,v)–>interactive-paths structure的向量o(q, v)
  • qv间多种interactive-paths structure的向量o(q, v)–> proximity embedding vector f(q,v)
  • 建立qv间的 proximity score (评分)
    π \pi π(q,v)= θ T \theta^T θTf(q,v)
    此处和前篇一样: θ \theta θ是 proximity estimation参数,需要学习的到;f是向量,也要学习的到
    在参数学习中,利用 π \pi π(q,a)> π \pi π(q,b)来学习

INTERACTIVE PATHS CONSTRUCTION

使用cycle-free shuffling mechanism来从qv之间的多条path建立interactive-paths structure

cycle-free shuffling mechanism

cycle-free shuffling mechanism分成两个步骤来建立interactive-paths structure:

  • Adding interdependencies:在多条path上添加有向边–依赖,就是上图中彩色的有向边。
  • Removing cycles:在添加新边的图上去掉环。
  1. Adding interdependencies
    方法很简单,就是找到路径上涉及到的点的除了路径上直接相连的,还有其他的可以相连的点,然后一次相连,如下图。
    在这里插入图片描述

  2. Removing cycles
    算法很简单,看图+我红笔写的备注就能明白,这样去掉了圈。
    在这里插入图片描述

通过1,2两部,便建立了INTERACTIVE PATHS CONSTRUCTION

INTERACTIVE PATHS EMBEDDING

使用interactive GRU mechanism来将interactive path sturcture I(q,v)嵌入成向量。

Interactive GRU

在这里插入图片描述
基本思路:表达点的向量->表达路径的向量->表达interactive path sturcture的向量

  1. 表达点的向量:使用前导点来表达当前点,考虑以下方面
  • Path heterogeneity:路径多样性,也就是表达这个点的时候,前导点和此点在一个路径上的贡献大,不在一个路径上的贡献小
  • Distance awareness:距离考虑,前导点如果距离问询节点近,就对此点有更大的贡献
  • Node heterogeneity:点的多样性,使用one-hot来编码点的类型。

建模:建立的网络和LSTM中的门一样,输入IN如下(考虑了Path heterogeneity,Distance awareness,Node heterogeneity,我用红笔解释了)

在这里插入图片描述
在这里插入图片描述
注意,前面表达式hRj是网络的IN

  1. 表达path的向量
  2. 表达interactive path structure的向量
  3. 表达multiple interactive path structure的向量
  4. promixity embedding
    如下:
    在这里插入图片描述
    其实就是一步步在使用maxpooling

总结:

  • 使用前导点的三点考虑+LSTM的门–>节点的向量–>maxpooling成path的向量–>structure的向量–>multiple structure的向量–>最终promixity embedding向量
  • 其中的参数:
    三点考虑的参数
    LSTM参数

END-TO-END TRAINING

和前篇一样:利用 π \pi π(q,a)> π \pi π(q,b)来学习在这里插入图片描述

结果:

  • 得到每个节点的向量
  • 得到路径向量
  • 得到struture向量
  • 得到proximity score 从而能知道问询节点p和那个目的节点v最相似。

总结

这篇论文我觉得和上一篇差不多,都是在之前path-based的方法的基础上更进一步,考虑到更高层次的结构问题来进行embedding。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值