- 论文地址:https://www.aclweb.org/anthology/P16-1087.pdf
- 发表会议:ACL2016
这篇论文是意见实体和关系联合抽取。作者称这是第一次尝试把深度网络用到意见实体和关系联合抽取上。以前利用crf等的传统联合抽取方法太依赖众多特征。
-
opinion analysis
所谓“意见分析(opinion analysis)","is to identify subjective expressions in text along with their associated sources and targets. "即确定一个主观的表达(expressions)和它关联的sources(holders)和targets。以及它们之间的relation。简化来说,就是我们需要抽取三种实体:opinion expressions,opinion holders,opinion targets。以及它们之间的关系is-from和is-about。 -
核心思想
网络结构方面作者并没有做什么改进,利用了类似Bi-LSTM+CRF的网络结构,BIO标签体系来抽取实体。而为了联合抽取实体间的关系,作者可以说是又构建出了一套用于关系的标签体系–distance。如下图所示,
由图可以看出,除了entity tags,作者又提出了dleft和dright,dleft是描述指向左边的关系箭头离当前位置的距离,比如图中从regards指向beijing的箭头,regards下的dleft为2,即这个箭头离它距离为2。同理有dright。dleft和dright描述了全部的实体间的关系(我觉得也可以合成一套标签,用±号表示方向)。同时这一套标签体系也完美适用于序列标注,所以可以和实体进行联合抽取。 -
输出和参数训练
因为不仅要输出entity type,还要输出relation(distance),所以每个位置输出不再是一个一维矩阵Y(指label的种类数),而是一个二维矩阵distance*Y。
另外类似于Bi-LSTM+CRF中的转移矩阵参数A,这里也需要训练一个转移矩阵参数。不过这个转移矩阵里的元素是从label i,distance j,转移到label i’,distance j’的概率。 -
不足
- 每个位置的输出是矩阵,导致输出过于稀疏,难于训练;
- 只确定了关系,没有确定关系类型;
作者在2017年的另一篇文章:Going out on a limb: Joint Extraction of Entity Mentions and Relations without Dependency Trees,基于本篇论文提出了新的模型,克服了上述两种不足。
参考:Investigating LSTMs for Joint Extraction of Opinion Entities and Relations