关于关系三元组抽取的一种新颖的级联的二元标注框架

文章探讨了文本中三元组共享同一实体的重叠问题,介绍了传统的命名实体识别和关系抽取方法的局限性。提出了一种名为CASREL的端到端级联二元标注框架,该框架利用BERT进行编码,并通过关系特定的宾语标注器解决重叠问题,将关系视为将主语映射到宾语的函数,从而能更有效地抽取关系三元组。

论文知识记录

三元组共享相同实体的重叠问题

        三元组共享相同实体的重叠问题是指在文本中存在多个关系三元组,而这些三元组在同一句子中共享相同的主语或宾语实体。具体来说,当一句话中存在多个关系描述,而这些关系描述都涉及到相同的实体时,就会出现重叠问题。

例如,考虑以下句子:

"John works at ABC Company. John is the CEO. John graduated from XYZ University."

        在这个例子中,三个句子描述了关于"John"这个实体的不同关系,即工作关系、职位关系和教育关系。这些关系共享相同的主语实体"John",因此存在重叠问题。

        解决重叠问题需要确定每个关系三元组中的实体是指的是相同的实体还是不同的实体。

关系三元组

        事实以(subject, relation, object)或(s, r, o)的形式存在,被称为关系三元组。

EPO(实体对重叠):不同关系之间实体对的重叠(主语以及宾语)

SEP(单个实体重叠):不同关系之间单个实体的重叠

早期三元组抽取方面的工作采取流水线的方法,然而有传播错误,并且忽略了两个步骤的相关性。

(1)首先在输入句子上运行命名实体识别(NER)以识别所有实体

(2)然后在提取出的实体对上运行关系分类(RC)

近期的有实体和关系的联合学习方法,包括基于特征的模型和基于神经网络的模型。

        大多数现有的神经模型(如Miwa和Bansal,2016)仅通过参数共享实现实体和关系的联合学习,而没有联合解码。

重叠问题挑战了原有的序列标注方案。

两种新的解决方案:

    &nb

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值