知识表示学习 (二) —— Gaussian space-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_43886056/article/details/111192914

本文深入探讨了KG2E和TransG两种知识图谱表示学习方法，利用Gaussian分布来处理实体和关系的不确定性。KG2E通过高斯分布表示实体和关系，用KL散度评估三元组的相似度；TransG则引入贝叶斯非参数高斯混合模型，解决关系多语义问题，通过中国餐馆过程自动发现关系的语义簇。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

知识表示学习 (二) —— Gaussian space

文章目录

知识表示学习 (二) —— Gaussian space

基于翻译的模型处理TransE及其变体的基于Point-Wise Space的模型，还有基于Gaussian space的模型，代表有KG2E、TransG等。

一、KG2E(2015)

论文链接：Learning to Represent Knowledge Graphs with Gaussian Embedding

Learning to represent knowledge graphs with gaussian embedding：高斯分步表示实体和关系

KG2E针对的问题：作者认为以前的方法都是将实体和关系嵌入到点向量空间中，这些模型总是以同样的方式看待所有的实体和关系，而实体库中的实体和关系本身就就存在不确定性，以前的方法模型忽略了这一不确定性。

作者指出了不确定性的多种影响因素：

关系两边的头实体和尾实体的不对称性
不同关系和实体连接的三元组数量的不同
关系的模糊不清

KG2E原理

KG2E不再采用点空间，而是采用基于密度的向量嵌入方法。作者使用Gaussian Distribution来表示实体和关系，用均值表示其所处的中心位置，用协方差来表示实体和关系的不确定度，采用KL散度用于对三元组进行打分。

论文中将每个关系和实体使用多维高斯分布 $\mathcal{N}(\mathcal{\mu},\mathcal{\Sigma})$ 表示。
在这里插入图片描述

图示中，带有下划线的表示关系，每个圆圈代表不同实体和关系的表示。圆圈越大代表其不确定性越大，从图中能够看出nationality这个关系的不确定性是最大的。

KG2E使用 $h - t$ 表示头尾实体之间的关系，可以计算得到概率分布表示：

$\mathcal{P}_e\sim\mathcal{N}(\mathbf{\mu}_h-\mathbf{\mu}_t,\mathbf{\Sigma}_h+\mathbf{\Sigma}_t)$

关系的概率分布为：

$\mathcal{P}_r\sim\mathcal{N}(\mathbf{\mu}_r,\mathbf{\Sigma}_r)$

然后可以评估 $\mathcal{P}_e$ 和 $\mathcal{P}_r$ 之间的相似度，论文中提出了两种评分方式。

1.非对称相似度：实体分布和关系分布之间的KL散度

$\begin{aligned} \mathcal{E}(h,r,t) & =\mathcal{E}(\mathcal{P}_e,\mathcal{P}_r)=\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_e,\mathcal{P}_r) \\ & = \int_{x\in\mathcal{R}^{k_e}}\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)\log\frac{\mathcal{N}(x;\mathbf{\mu}_e,\mathbf{\Sigma}_e)}{\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)}dx \\ & = \frac{1}{2}\{tr(\mathbf{\Sigma}_r^{-1}\mathbf{\Sigma}_e)+(\mathbf{\mu}_r-\mathbf{\mu}_e)^{\top}\Sigma_r^{-1}(\mathbf{\mu}_r-\mathbf{\mu}_e)-\log\frac{\det(\Sigma_e)}{\det(\Sigma_r)}-k_e\} \end{aligned}$

定义基于KL散度的对称的相似度度量方法

$\mathcal{E}(h,r,t)=\frac{1}{2}(\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_e,\mathcal{P}_r)+\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_r,\mathcal{P}_e))$

2.对称相似度：采用期望似然，使用两个分布的内积作为度量两个分布的相似度。

$\begin{aligned} \mathcal{E}(\mathcal{P}_e,\mathcal{P}_r) & = \int_{x\in\mathcal{R}^{k_e}}\mathcal{N}(x;\mathbf{\mu}_e,\mathbf{\Sigma}_e)\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)dx \\ & = \mathcal{N}(0;\mathbf{\mu}_e-\mathbf{\mu}_r,\mathbf{\Sigma}_e+\mathbf{\Sigma}_r) \end{aligned}$