一、核心思想
基于Harris等人的分布式假说,作者认为,如果两个关系表示包含相同的实体对,那么两个关系表示应该是相似的。运用大量的无监督数据,在BERT的预训练过程中(Masked LM任务)额外添加MTB(Matching The Blanks)任务,在预训练阶段提升了关系抽取的性能。
二、问题描述
本文定义一个关系表述(relation statement)为 r =(x,s1,s2)。
其中 x = [x0…xn],为一个句子中的token序列。x0为[CLS],xn为[SEP],分别表示开始标志和结束标志。
s1 =(i,j),s2 =(k,l),i,j,k,l均为整数,表示句子中实体的位置。[xi…xj-1]表示一个实体,[xk…xl-1]表示另一个实体。
目标是习得一个映射函数:
hr是一个固定维度(d维)的向量。
三、对基于BERT的一些关系编码器的评估
这部分主要研究两个问题:
1.在BERT输入中,应该如何表示实体(主要是实体的位置信息)。
2.如何从BERT的输出中得到固定维度的表示。
对于问题1,有三种方案:
① STANDARD:标准输入,不使用实体的位置信息,即不使用s1和s2;
②