[ACL2019 Best Paper] Bridging the Gap between Training and Inference for Neural Machine Translation

最新推荐文章于 2025-01-09 16:36:13 发布

原创最新推荐文章于 2025-01-09 16:36:13 发布 · 1.8k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#ac2019l #NLP #神经网络

NLP 同时被 2 个专栏收录

2 篇文章

订阅专栏

2 篇文章

订阅专栏

ACL2019 Best Long Paper解读：

目的：解决训练数据的Teacher Forcing问题
训练时使用true ground数据，而推断时使用预测结果作为上文，在训练时会造成overcorrection（同义词结果被过度矫正）
提出在训练时不仅仅使用true ground label，还会结合oracle word作为上下文，结构如下：

在原始NTM的基础上，在j时，输入j-1不再仅仅使用true groud label，而是会结合oracle word（soft机制），文章的重点在于如何选择oracle word，提出两种方式：词粒度和句子粒度。

使用oracle word机制的三步走：

Word-Level Oracle(WO)机制
直接拿预测概率最大的输出作为oracle word，下图及公式(9)所示

引入Gumbel noise正则项增加模型鲁棒性

Sentence-Level Oracle (SO)
在每个step时，对batch内样本做beam search decode，使用BLEU进行效果度量，得到最优目标句子，句子中第j-1个word作为SO

由于SO及来自于true ground又来自于beam search，所以需要二者长度对齐，对齐方式使用Force Decoding
Force Decoding：根据EOS作为判断，步骤如下：

Sampling with Decay 原则：训练开始的时候倾向于使用true ground label，训练后期倾向于选择oracle word
p控制true groud和oracle word的选择，衰减公式如下，e为epoch，μ为超参

结果展示：使用Transformat结果效果好用RNN，引入sentence oracle效果好于WO

总结：文章创新性地使用了soft label作为next step的输入，可以解决训练过程中的「过度矫正及误差累及」问题，该方法在NMT上提及，但感觉可以扩展应用到其他「联合训练的模型上」，第二个任务基于第一个任务的输出label，在训练阶段可采用此soft label选取的方法。

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。