语义角色标注(Semantic Role Labeling,SRL)的使用范围很广泛,可以作为信息抽取(Information Extraction)、自动答复(Question Answering)、机器翻译(Machine Translation)的中间步骤。本篇博文将介绍 Zhou and Xu, 2015 的一篇论文,希望能对读者有所启发。
SRL的目标是找到给定句子里的谓词(predicate)相关的成分与此谓词的角色关系,被认为是一种监督学习问题(supervised machine learning)。传统方法中,比如逻辑回归(Logistics Regression,LR)、支持向量机(Supported Vector Machine,SVM)等线性分类器基于特征来完成此任务:
- 确定成分是否与谓词相关;
- 如果相关是何种关系类型?
在特征中,句法信息(syntactic information)被认为是必不可少的(Punyakanok etal., 2008a),因为成分在句法树(semantic tree)中的位置提供了中间的标签类型,有助于提高性能。然而要得到一颗句法树就必须对句子进行解析(semantic parse),而解析不能保证完全正确,因此基于句法树的方法错误会传导至最终SRL的结果。此外,如何选取特征严重依赖专家经验,费时费力,而且当换了语料或者使用其他语言的预料时又得重新设计特征模板,费时费力!
本篇论文作者提出了end-to-end的BD-LSTM模型(bi-directional long short-term memory)来解决上述