TensorFlow深度学习实战(16)——编码器-解码器架构
0. 前言
编码器-解码器架构也称 Seq2Seq (Sequence-to-Sequence) 模型,是一种用于处理序列数据的深度学习模型,广泛应用于自然语言处理任务中,如机器翻译、文本摘要、对话生成等。在 Seq2Seq 模型中,输入和输出都是序列形式,因此非常适用于需要将一个序列映射到另一个序列的任务。在本节中,将介绍 Seq2Seq 模型架构,并实现 Seq2Seq 模型用于机器翻译。
1. Seq2Seq 模型简介
多对多网络类型与多对一网络的区别在于,循环神经网络 (Recurrent Neural Network, RNN) 在每个时间步返回输出,而不是在最后返回单个组合输出;此外,另一个特征是输入时间步的数量等于输出时间步的数量。而在编码器-解码器架构中,另一个区别在于,输出与输入是同步的,即网络不必等到所有输入被处理完毕才能生成输出。
编码器-解码器 (Encoder-Decoder) 架构也称为 Seq2Seq 模型,顾名思义,网络由编码器和解码器部分组成,两者都基于 RNN,能够处理并返回对应于多个时间步的输出序列。Seq2Seq 网络最流行的应用是在
订阅专栏 解锁全文
2044

被折叠的 条评论
为什么被折叠?



