Keras深度学习实战(36)——基于编码器-解码器的机器翻译模型
0. 前言
在《机器翻译模型》一节中,我们已经学习了机器翻译的基本概念,并使用 Keras
构建了两种基本的机器翻译模型,但由于在传统模型中所有输入时间戳的信息仅存储在最后一个网络中间状态值中,因此会丢失大量信息。本节中,通过引入编码器-解码器
结构改善机器翻译模型,以获得更加优秀的性能。
1. 模型与数据集分析
1.1 数据集分析
在本节中,我们继续使用在《机器翻译模型》一节中使用的数据集,并使用相同的数据预处理过程,因此在继续学习之前,需要结合《机器翻译模型》一节阅读。
1.2 模型分析
针对传统《机器翻译模型》体系结构的缺陷,我们从以下两个方面进行修改:
- 生成翻译时,利用单元状态中存在的信息