Classifying Relations via Long Short Term Memory Networks along Shortest Dependency Paths(2015)论文阅读笔记
一、背景
SVM
RNN
MV-RNN
FCM
CNN
CR-CNN
本文基于以下三点原因,提出了SDP-LSTM(基于最短依存路径的LSTM)模型用于关系分类:
①最短依存路径包含大量信息:
最短依存路径中的单词集中包含了大部分信息,噪声很少,而其他单词信息较少,且可能带来大量噪声。
②方向很重要:
由于在依存树中,两个词的方向不同,会导致其依赖关系不同,且关系类型也具有方向性,所以,将SDP划分为两个子路径,每个子路径为从一个实体到共同的祖先节点。将提取的特征沿两个子路径连接起来进行最终的分类。
③外部语言信息可帮助提升效果:
本文采用words本身,POS,WordNet上义词,以及grammatical relations between governing words and their children四种特征。
二、模型
以句子“A trillion gallons of water have been poured into an empty region of outer space”为例,下图为其依存解析树。