1、NMT(Neural Machine Translation)简介
NMT框架可以简单地表示为如下图:输入句子经过编码得到上下文向量context,context再经过译码得到输出句子

可具体表示为

论文Sequence to Sequence Learning with Neural Networks称这个框架为序列到序列(sequence-to-sequence)
![]()
the context vector为,
,
,![]()
![]()
输出![]()

2、准备数据
本文以德文翻译成英文为例,数据集下载https://nlp.stanford.edu/projects/nmt/
一对数据为
![]()
本文句子长度设为固定值,输入句子为L,输出为M,为此将上面数据对处理成如下,其中<s>为开始符,</s>为结尾符
![]()
为了让模型再译码阶段学习到更多的输入信息,可以将输入句子反转
![]()
3、构建模型
xxx
4、性能提升
预训练词向量
teach foucing
Attention

论文Neural Machine Translation by Learning to Jointly Align and Translate

![]()


![]()
本文介绍神经机器翻译(NMT)的基本框架,包括序列到序列(sequence-to-sequence)模型,以及通过预训练词向量、teachfoucing和Attention机制来提升翻译性能的方法。并以德文翻译成英文为例,详细讲解数据准备、模型构建过程。
3201

被折叠的 条评论
为什么被折叠?



