(2018 -NIPS)SimplE embedding for link prediction in knowledge

本文介绍了SimplE,一种在知识图谱链接预测中表现优秀的简单嵌入模型,通过解决CP分解中实体嵌入的独立性问题,实现了完全表达和参数共享背景知识。实验结果证明其性能超越先进方法。

(2018 -NIPS)SimplE embedding for link prediction in knowledge

本文为阅读论文过程中的个人总结加上翻译内容构成。

摘要

介绍知识图谱,知识图谱补全(链接预测),并说明了张量分解方法(Tensor factorization approaches)对于这类问题有着显著的效果,其中正则多元分解( Canonical Polyadic (CP))是最早的张量分解方法,但CP是有局限性的,它学习了每个实体的两个独立的嵌入向量,而它们实际上是绑定的。我们提出了一个简单的CP增强(我们称之为simpIE),以允许独立地学习每个实体的两个嵌入。简单算法的复杂度随嵌入的大小线性增长。通过simpleare学习到的嵌入是可解释的,某些类型的背景知识可以通过权重绑定被纳入这些嵌入。我们证明了simple是完全表达的,并为充分表达推导了其嵌入的大小的界限。我们通过经验证明,尽管simplet很简单,但它的性能优于几种最先进的张量分解技术。

GitHub地址:https://github.com/Mehran-k/SimplE.

相关介绍:

浅谈张量分解(一):如何简单地进行张量分解?

1. 介绍

第一段介绍,知识图谱补全是在统计关系学习(SRL)的框架下,看成在现有三元组的基础上预测新的三元组的过程。

第二段介绍张量分解被证明是一种有效的SRL方法,预测的评判标准是将三元组作为输入,输出一个概率代表该三元组是否正确的概率。

张量分解的第一种方法是正则多元(CP)分解。该方法为每个关系学习一个嵌入向量,为每个实体学习两个嵌入向量,当实体是头时使用一个,当实体是尾时使用一个。一个实体的头部嵌入是独立于(并且与)其尾部嵌入无关的。这种独立性导致CP在KG补全中表现不佳。本文提出了一种基于CP的张量分解方法,解决了实体的两个嵌入向量之间的独立性问题。由于模型的简单性,我们称其为simple (SimpleEmbedding)。

本文证明了:

  • 可以被认为是一个双线性模型
  • 是完全表达的
  • 能够通过参数共享将背景知识编码到它的嵌入中
  • 尽管原理很简单,但在经验上表现得非常好。我们还讨论了其他现有方法的几个缺点
  • 证明了现有的一些编码方法并不能完全表达,并找出了表达的严格限制
  • 证明了ComplEx是一种最先进的链路预测方法,涉及到冗余计算

2. 背景和符号

定义了一些符号,例如:(具体定义建议看原文,更清楚,这里只列出定义了哪些)

  • 小写字母表示向量,大小字母表示矩阵,向量拼接的公式,向量乘积的公式: ⟨ v h , v r , v t ⟩ \left\langle v_{h}, v_{r}, v_{t}\right\rangle vh,vr,vt
  • 知识图谱头实体、尾实体、关系的集合定义、正确三元组集合、错误三元组集合
  • 定义对称关系、非对称关系以及传递关系、以及关系的倒数

3. 相关工作

普通嵌入方法

定义:头实体为简单向量 v e ∈ R d v_{e} \in \mathbb{R}^{d} veRd ,尾实体为 v r ∈ R d ′ v_{r} \in \mathbb{R}^{d^{\prime}} vrRd以及两个矩阵: P r ∈ R d ′ × d P_{r} \in \mathbb{R}^{d^{\prime} \times d} PrRd×d Q r ∈ R d ′ × d Q_{r} \in \mathbb{R}^{d^{\prime} \times d} QrRd×d

同时得分函数的定义为: ∥ P r v h + v r − Q r v t ∥ i \left\|P_{r} v_{h}+v_{r}-Q_{r} v_{t}\right\|_{i} Prvh+vrQrvti P r v h + v r ≈ Q r v t ) \left.P_{r} v_{h}+v_{r} \approx Q_{r} v_{t}\right) Prvh+vrQrvt)

例如:

  • TransE中: d = d ′ , P r = Q r = I d d=d^{\prime}, P_{r}=Q_{r}=\mathcal{I}^{d} d=d,Pr=Qr=Id
  • TransR中: P r = Q r . P_{r}=Q_{r} . Pr=Qr.
  • STransE中:对矩阵没有限制
  • FTransE中:定义得分函数为 ∥ P r v h + v r − α Q r v t ∥ i \left\|P_{r} v_{h}+v_{r}-\alpha Q_{r} v_{t}\right\|_{i} Prvh+vrαQrvti

本文中采用FSTransE代替FTransE,结合两者的优点。

相乘嵌入方法

Multiplicative Approaches 是什么意思

DistMult:(最简单的方法之一)

  • 定义实体和关系的嵌入为 v e ∈ R d v_{e} \in \mathbb{R}^{d} veR
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fadeGR

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值