人工智能概念：RNN中的基础Encoder-Decoder框架

RNN中Encoder-Decoder框架及注意力机制

原创

已于 2025-07-05 14:01:40 修改 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-07-04 15:31:17 首次发布

在自然语言处理领域，序列到序列（Seq2Seq）模型是实现跨序列转换的基础框架，其核心依托Encoder-Decoder（编码器-解码器）架构。该架构通过两个协同组件完成序列转换：

经典应用场景：

机器翻译：中文句子 → 英文句子

文本摘要：新闻长文 → 精简摘要

语音识别：音频特征序列 → 文字序列

在这里插入图片描述
RNN家族介绍：网页链接

编码阶段：
输入序列通过编码器压缩为固定维度的语义向量 $F(X_1, X_2, \dots, X_m)$ ，其中 $F$ 为非线性变换函数。
解码阶段：
解码器基于唯一的 $C$ 和已生成的历史词 $y_1, y_2, \dots, y_{i-1}$ ，逐词生成目标序列。特别地，解码过程会添加特殊标记：
- 输入端添加作为生成起始信号（如 $y_0 = <GO>$ ）；
- 输出端通过标记序列结束（如生成 $y_n = <EOS>$ 时终止）。
  完整生成逻辑为：
  $y_i = G(C, y_0, y_1, \dots, y_{i-1}) \quad (\text{其中} \ y_0 = <GO>)$