知识表示学习 (二) —— Gaussian space

本文深入探讨了KG2E和TransG两种知识图谱表示学习方法,利用Gaussian分布来处理实体和关系的不确定性。KG2E通过高斯分布表示实体和关系,用KL散度评估三元组的相似度;TransG则引入贝叶斯非参数高斯混合模型,解决关系多语义问题,通过中国餐馆过程自动发现关系的语义簇。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

知识表示学习 (二) —— Gaussian space


  基于翻译的模型处理TransE及其变体的基于Point-Wise Space的模型,还有基于Gaussian space的模型,代表有KG2E、TransG等。

一、KG2E(2015)

论文链接Learning to Represent Knowledge Graphs with Gaussian Embedding

Learning to represent knowledge graphs with gaussian embedding:高斯分步表示实体和关系

  KG2E针对的问题:作者认为以前的方法都是将实体和关系嵌入到点向量空间中,这些模型总是以同样的方式看待所有的实体和关系,而实体库中的实体和关系本身就就存在不确定性,以前的方法模型忽略了这一不确定性。

  作者指出了不确定性的多种影响因素:

  • 关系两边的头实体和尾实体的不对称性
  • 不同关系和实体连接的三元组数量的不同
  • 关系的模糊不清
    在这里插入图片描述

  KG2E原理

  KG2E不再采用点空间,而是采用基于密度的向量嵌入方法。作者使用Gaussian Distribution来表示实体和关系,用均值表示其所处的中心位置,用协方差来表示实体和关系的不确定度,采用KL散度用于对三元组进行打分。

  论文中将每个关系和实体使用多维高斯分布 N ( μ , Σ ) \mathcal{N}(\mathcal{\mu},\mathcal{\Sigma}) N(μ,Σ)表示。
在这里插入图片描述

  图示中,带有下划线的表示关系,每个圆圈代表不同实体和关系的表示。圆圈越大代表其不确定性越大,从图中能够看出nationality这个关系的不确定性是最大的。

  KG2E使用 h − t h-t ht表示头尾实体之间的关系,可以计算得到概率分布表示:

P e ∼ N ( μ h − μ t , Σ h + Σ t ) \mathcal{P}_e\sim\mathcal{N}(\mathbf{\mu}_h-\mathbf{\mu}_t,\mathbf{\Sigma}_h+\mathbf{\Sigma}_t) PeN(μhμt,Σh+Σt)

  关系的概率分布为:

P r ∼ N ( μ r , Σ r ) \mathcal{P}_r\sim\mathcal{N}(\mathbf{\mu}_r,\mathbf{\Sigma}_r) PrN(μr,Σr)

  然后可以评估 P e \mathcal{P}_e Pe P r \mathcal{P}_r Pr之间的相似度,论文中提出了两种评分方式。

  1.非对称相似度:实体分布和关系分布之间的KL散度

E ( h , r , t ) = E ( P e , P r ) = D K L ( P e , P r ) = ∫ x ∈ R k e N ( x ; μ r , Σ r ) log ⁡ N ( x ; μ e , Σ e ) N ( x ; μ r , Σ r ) d x = 1 2 { t r ( Σ r − 1 Σ e ) + ( μ r − μ e ) ⊤ Σ r − 1 ( μ r − μ e ) − log ⁡ det ⁡ ( Σ e ) det ⁡ ( Σ r ) − k e } \begin{aligned} \mathcal{E}(h,r,t) & =\mathcal{E}(\mathcal{P}_e,\mathcal{P}_r)=\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_e,\mathcal{P}_r) \\ & = \int_{x\in\mathcal{R}^{k_e}}\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)\log\frac{\mathcal{N}(x;\mathbf{\mu}_e,\mathbf{\Sigma}_e)}{\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)}dx \\ & = \frac{1}{2}\{tr(\mathbf{\Sigma}_r^{-1}\mathbf{\Sigma}_e)+(\mathbf{\mu}_r-\mathbf{\mu}_e)^{\top}\Sigma_r^{-1}(\mathbf{\mu}_r-\mathbf{\mu}_e)-\log\frac{\det(\Sigma_e)}{\det(\Sigma_r)}-k_e\} \end{aligned} E(h,r,t)=E(Pe,Pr)=DKL(Pe,Pr)=xRkeN(x;μr,Σr)logN(x;μr,Σr)N(x;μe,Σe)dx=21{ tr(Σr1Σe)+(μrμe)Σr1(μrμe)logdet(Σr)det(Σe)ke}

  定义基于KL散度的对称的相似度度量方法

E ( h , r , t ) = 1 2 ( D K L ( P e , P r ) + D K L ( P r , P e ) ) \mathcal{E}(h,r,t)=\frac{1}{2}(\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_e,\mathcal{P}_r)+\mathcal{D}_{\mathcal{KL}}(\mathcal{P}_r,\mathcal{P}_e)) E(h,r,t)=21(DKL(Pe,Pr)+DKL(Pr,Pe))

  2.对称相似度:采用期望似然,使用两个分布的内积作为度量两个分布的相似度。

E ( P e , P r ) = ∫ x ∈ R k e N ( x ; μ e , Σ e ) N ( x ; μ r , Σ r ) d x = N ( 0 ; μ e − μ r , Σ e + Σ r ) \begin{aligned} \mathcal{E}(\mathcal{P}_e,\mathcal{P}_r) & = \int_{x\in\mathcal{R}^{k_e}}\mathcal{N}(x;\mathbf{\mu}_e,\mathbf{\Sigma}_e)\mathcal{N}(x;\mathbf{\mu}_r,\mathbf{\Sigma}_r)dx \\ & = \mathcal{N}(0;\mathbf{\mu}_e-\mathbf{\mu}_r,\mathbf{\Sigma}_e+\mathbf{\Sigma}_r) \end{aligned} E(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值