论文阅读：A semantically enhanced dual encoder for aspectsentiment triplet extraction

huihui12a

于 2024-11-14 16:05:37 发布

阅读量728

点赞数 17

CC 4.0 BY-SA版权

分类专栏：论文阅读文章标签：论文阅读

本文链接：https://blog.youkuaiyun.com/zhangxiaohuiNO1/article/details/143773575

论文阅读专栏收录该内容

26 篇文章

订阅专栏

Basic context encoder

Particular context encoder

2 Encoding interaction module

3 Boundary-driven Table-filling layer

4 解码和损失函数

一、背景

原来的方法包括：（1）pipline方法，例如两阶段模型，在第一阶段从句子中提取aspect、opinion、sentiment；在第二阶段组成合适的triplet。存在的问题是pipline方法破坏了triplet元素之间的关系，没办法捕获他们之间的交互。（2）joint model。能用一个统一的方式捕获子任务之间的交互，包含 table-filling或者span-based策略。

存在的问题：原来的pipline或者端到端的方法，侧重于创建不同的提取方案来解决ASTE，但是忽略了一个巧妙设计的编码器来增强高阶语义的捕获。一个有效的编码器可以考虑特定的语义，包括语法依赖关系、词性标签和位置信息等隐藏特征。句子中的高阶信息可以通过标记之间的附加语义来表示

二、创新点

为了利用高阶语义的优势，我们提出了一个语义增强的双编码器框架。我们构建了一个BERT编码器来编码句子的基本语义，并使用了一个增强了三域嵌入的Bi-LSTM编码器来提取特定的语义，该编码器可以区分不同语境下的词性和语义差异。

对于得到的语义，采用GCN基于依赖树对结构特征进行细化。编码交互模块迭代地从这两个角度融合文本的语义。

与当前基于管道和跨度的方法不同，我们的方法基于边界驱动的表填充（BDTF）提取情感三元组

（1）提出了一个语义增强的双编码器框架，包括两个不同的编码器。基于BERT的基本编码器捕获句子的基本语义，基于GCN和具有3域嵌入的Bi-LSTM的特定编码器从依赖树中挖掘上下文特定的语义；

（2）引入语义编码交互策略，迭代结合两个编码器学习到的语义信息，综合表达句子的语义，包括基本语境、特定评论语境、词性信息和依赖信息。

三、模型框架

1 Encoder

Basic context encoder

由于BERT使用子词拆分，因此获得的上下文特征h在维度上可能与原始句子长度不一致。为了解决这个问题，我们设计了一个Whitetokenizer，它在标记化过程中跟踪每个单词被分成子词。我们使用平均池对子词进行对齐，聚合它们的上下文特征以获得句子的对齐上下文语义hb。

Particular context encoder

首先为了准确地捕捉不同领域中单词的语义倾向，我们使用了两个查找表来初始化文本嵌入，一般的域嵌入表Eg∈R |v|×dg表示广泛上下文中单词的含义，而特定的域嵌入表Es∈R |v|×ds在特定于被分析评论的上下文中捕获它们。这里，|v|表示查找表中词汇表的大小。并且加入词性嵌入表。P = [pnoun, pverb, padj , padv, pothers]Ep ∈ R5×dp。经过三域嵌入层后，最终的句子表示为：