Synchronous Double-channel Recurrent Network for Aspect-Opinion Pair Extraction阅读笔记
1.摘要
探索aspect opinion pair extraction(方面意见对提取 AOPE),目的是成对的提取方面和意见表达。
提出了同步双通道递归网络(SDRN),主要由实体提取单元,关系检测单元和同步单元组成。将意见实体提取单元和关系检测单元作为两个通道同时提取意见实体和关系。此外,在同步单元中,我们设计了实体同步机制(ESM)和关系同步机制(RSM),以增强两种渠道的互利性。
2.介绍
以往的研究表明了意见实体抽取的重要性,并取得了很大的进展,但是却忽略了方面和观点表达之间的关系。
方面和表达观点之间的关系的研究还比较少。只有找到方面词和观点词之间的关系,才能执行更细粒度的任务。
举例:
挑战:首先,一个句子中方面和观点表达的关系结构可能很复杂,这就要求模型在检测关系时有效且灵活。例如,这些关系可以是一对多、多对一,甚至嵌入或重叠。
第二,观点实体提取和关系检测并不像其他多任务学习问题那样是两个独立的任务,而是相互依赖的,因此如何正确地融合和学习这两个子任务是一个关键的挑战。
第三,如何实现意见实体提取与关系检测的同步,使二者相互促进是另一个主要的挑战。
作者提出了Synchronous Double-channel Recurrent Network (SDRN 同步双通道递归网络)。
具体来说,先利用transformers(bert)的双向编码器表示来学习上下文,然后构造由意见实体提取单元和关系检测单元构成的双通道递归网络(以同时提取方面、意见表达和关系)。为了实现两个通道之间的交互,我们设计了实体同步机制(ESM)和关系同步机制(RSM)。
本文的主要贡献:
- 探讨了AOPE任务,对于下游任务是有价值的和关键的,但是仍有待研究。
- 提出了新模型SDRN。
- 根据2014年和2015年的SemEval基准,为AOPE任务手动构建了三个数据集。
3.模型
给定一个评论句子S,AOPE任务的目标是从S中抽取一组方面意见对 C={αm,om}Mm=1 ,这里的αm和om分别表示方面和意见表达。
SDRN架构如下所示:
具体流程如下:
首先,通过bert编码层来学习上下文表示。然后,将意见实体提取单元和关系检测单元构造双通道,同时提取方面、意见表达和关系。此外,还设计了一个同步单元来实现双通道的交互。为了捕获高层表示,我们反复执行上述单元。在经过多个递归步骤后,我们采用一个推理层来获得方面意见对。
3.1 编码层
对于给定的评论S,首先使用WordPiece词典对其进行标记,并在标记化句子的开头和结尾分别添加标记[CLS]和[SEP]。获得了输入序列 X={x1<