论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

这篇论文提出了一种新颖的模型,通过模拟辩论动态在知识图谱上进行推理。两个智能体分别寻找证据证明三元组为真或假,而法官整合证据做出判断。模型基于LSTM网络,使用强化学习优化智能体策略,最终实现更可解释的推理过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这是一篇非常有趣的工作,看完会觉得眼前一亮。
论文标题:Reasoning on Knowledge Graphs with Debate Dynamics
发表于AAAI,2020

动机

 很多机器学习的任务都是通过将节点与关系嵌入,并计算三元组置信度得分,然后最大化正例的得分得到嵌入向量,但究竟哪一部分对最终的得分起作用是难以解释的,本文模型有个三个模块,分别是两个agent和 judge,对于待查询三元组:q=(sq,pq,oq)q=\left(s_{q}, p_{q}, o_{q}\right)q=(sq,pq,oq),两个agent分别寻找证据链证明此三元组为True和False,并有Judge整合所有证据,得到最终结果。(听起来有点像GAN,但看下去会发现并不是)

Agent模块

  定义状态States:   记et(i)e_t^{(i)}et(i)为第i个agent在t时刻查询的位置,则目前的状态可记为:St(i)=(et(i),q)∈S=E2×R×ES_{t}^{(i)}=\left(e_{t}^{(i)}, q\right) \in \mathcal{S} = \mathcal{E}^{2} \times \mathcal{R} \times \mathcal{E}St(i)=(et(i),q)S=E2×R×E
  定义行动Actions:从状态St(i)=(et(i),q)S_{t}^{(i)}=\left(e_{t}^{(i)}, q\right)St(i)=(et(i),q)出发,所有可能到达的节点集合(即et(i)e_t^{(i)}et(i)的邻居集),记做ASt(i)\mathcal{A}_{S_{t}^{(i)}}ASt(i)
ASt(i)={ (r,e)∈R×E:St(i)=(et(i),q)∧(et(i),r,e)∈KG} \mathcal{A}_{S_{t}^{(i)}}=\left\{(r, e) \in \mathcal{R} \times \mathcal{E}: S_{t}^{(i)}=\left(e_{t}^{(i)}, q\right) \wedge\left(e_{t}^{(i)}, r, e\right) \in \mathcal{K} \mathcal{G}\right\} ASt(i)={ (r,e)R×E:St(i)=(et(i),q)(et(i),r,e)KG}
  定义转移过程:若在状态St(i)=(et(i),q)S_{t}^{(i)}=\left(e_{t}^{(i)}, q\right)St(i)=(et(i)

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值