文本与图结构建模:提升输入表示的有效方法
在自然语言处理(NLP)领域,如何有效建模文本和图结构是提升模型性能的关键。本文将深入探讨几种先进的建模方法,包括基于集成编码器的文档建模、卷积句子编码器的文档建模以及图结构的建模方法。
1. 基于集成编码器的文档建模
以往,Tan等人使用独立的词编码器对文档中的句子进行建模。而Celikyilmaz等人在2018年提出了一种层次化文档编码器,采用协作编码器对文档的不同段落进行编码,这些段落编码器被称为“代理”。
这个过程可以用以下流程图表示:
graph LR
A[文档] --> B[段落1]
A --> C[段落2]
A --> D[段落3]
B --> E[代理1编码]
C --> F[代理2编码]
D --> G[代理3编码]
E --> H[广播编码信息]
F --> H
G --> H
H --> I[共享全局上下文信息]
I --> J[多层迭代]
J --> K[传递最终段落表示]
K --> L[顺序解码器生成摘要]
1.1 多代理编码器消息传递
每个代理使用多层双向LSTM将段落编码为单词序列。在每一层,代理之间相互通信,修改段落表示,共享文本不同部分的全局上下文。
以代理a在第(k + 1)层为例,Bi - LSTM在步骤i的输入包括上一层的状态、左右编码器的状态以及其他代理
超级会员免费看
订阅专栏 解锁全文
4万+

被折叠的 条评论
为什么被折叠?



