
End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures
概述
本篇论文应该是最早提出基于神经网络的联合学习(实体识别、实体关系抽取两个子任务联合学习)的方法。
主要的思想是序列LSTM和树型LSTM的叠加,主要的过程是,首先通过序列LSTM识别出相应
的实体,然后树型LSTM根据识别出来的实体结果,进行实体关系分类。两个LSTM之间共享
编码层参数,具体的可以看下面的总体结构图。下面详细讲一下框架的细节。

词嵌入层
词的向量表示融合了多种特征,包括词本身以及词性(part-of-speech)。
文章最后实验提到了用word2vec的结果初始化词向量。
序列LSTM
文章中用的序列双向LSTM是Graves在2013年提出的变体。在我上一篇写的文章Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classifica