论文浅尝 | Complex Embeddings for Simple Link Prediction

最新推荐文章于 2024-11-29 18:07:20 发布

转载最新推荐文章于 2024-11-29 18:07:20 发布 · 5.1k 阅读

文章标签：

#kg embedding

KBQA 专栏收录该内容

2 篇文章

订阅专栏

本文探讨了基于复数表示的ComplEx模型如何解决知识图谱中的链接预测问题，尤其在非对称关系上的优势。通过引入复数向量表示，ComplEx能更准确地捕捉实体间复杂的关系特性。

读完Knowledge Graph Embedding with Iterative Guidance from Soft Rules的大致思想后，好奇为什么要用复数来表示一个向量，就想看另一篇论文：

Complex Embeddings for Simple Link Prediction
然后发现，有个博客很好的说了这个事，我就转过来以后学习

博客：论文浅尝 | Complex Embeddings for Simple Link Prediction

在这里插入图片描述

论文链接：[Complex Embeddings for Simple Link Pred]（http://proceedings.mlr.press/v48/trouillon16.pdf）
在统计关系学习里，链接预测问题是自动理解大规模知识库结构的核心。为了更好得把握知识库二元关系中的对称和非对称关系，本文提出了基于复数的表示方法 ComplEx。

一些研究工作将链接预测看作是三维二元张量补全的问题，张量的每一个slice表示知识库中关于一种关系的临接矩阵。典型的做法是对表示知识库的张量进行低秩分解，用分解得到的矩阵的每一行表示知识库中的一个实体或者一种关系。最后对于一个给定的三元组 r(s,o)（注：即主语 s 和宾语 o 具有关系 r），这个三元组的 score 可以通过对于 s,r,o 的表示向量之间的多线性(multi-linear)乘积计算得到。以往工作的问题在于不能很好地处理非对称关系，因为实数向量之间的点积计算是具有交换性的，即如果实数表示下的 r(s,o) 成立，那么 r(o,s) 也必然成立，但在知识库中非对称关系的比例远多于对称关系的比例。所以本文提出了一个基于复数表示的方法，因为复数之间的埃尔米特乘积(Hermitian dot product)是不具有交换性的，具体做法如下：

每个实体和关系都用一个复数向量表示，每个三元组的 score function 定义如下：

在这里插入图片描述