A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

本文探讨了如何通过级联二级制框架解决句子中实体关系的重叠问题,SubjectTagger仅标记边界,而Relation-specificObjectTaggers则针对每个subject预测对应关系的object。模型在处理NYT数据集中复杂的关系时效率低,强调了优化复杂度的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

Abstract

本文提出了关系三元组重叠的问题(一个sentence中有多个三元组,其中三元组中有的实体是同一个)。本文将其建模为级联二级制框架,从原来的f(s,o)→rf(s,o) \rightarrow rf(s,o)r从实体对找关系的过程,变成fr(s)→of_r(s) \rightarrow ofr(s)o给定头实体,针对头实体可能的关系,预测尾实体。即头实体不一定是subject,与multi-QA思想相似。
在这里插入图片描述

Model

在这里插入图片描述
在这里插入图片描述

给定标记好的句子xjx_jxj,和xjx_jxj中潜在的重叠实体三元组集Tj={(s,r,o)}T_j=\{(s,r,o)\}Tj={(s,r,o)}。先找到sss,再对关系rrr,找到其对应的ooo

Subject Tagger

本文中的subject和object只需找到边界,无需确定类型,首先找到句子中所有的subject,用0,1类别判定,不识边界的用零表示,对于句子中的多个subject会出现多个间隔的1,此时用就进原则,这里并不能解决关系重叠问题啊
在这里插入图片描述

Relation-specific Object Taggers

针对每一个subject,遍历多有关系r,为每个关系确定一个object,如果object不存在,则用None表示。与头实体标记器直接解码BERT输出的向量不同,关系特定object标记器也考了头实体的特征
在这里插入图片描述
vsubkv_{sub}^kvsubk表示低层模块中的头实体表示向量,为了保持xix_ixivsubkv_{sub}^kvsubk保持维度一致,如果头实体有多个词语组成,则选择使用vsubkv_{sub}^kvsubk的平均向量。

Result

在这里插入图片描述

启示

  1. 对于NYT数据集来说,每一个头实体对应20多种关系,要遍历20多遍,想想这个复杂度就让人头疼
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值