翻译模型

从1980年的基于规则翻译到2017年谷歌的Transformer模型,回顾翻译模型发展历程,包括统计翻译、神经网络翻译及注意力机制的引入,解析不同阶段的关键技术和突破。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

翻译模型发展史

1980年,提出基于规则的翻译
1993年,IBM提出基于词的统计翻译模型
2003年,Koehn提出基于短语的统计翻译模型
2014年,谷歌和蒙特利尔大学提出端到端神经网络机器翻译,Sequence to Sequence Learning with Neural NetworksLearning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation,即seqtoseq
2015年,德国雅各布大学基于seqtoseq模型,引入attention机制,即Neural Machine Translation by Jointly Learning to Align and Translate
2017年,谷歌发表Attention Is All You Need提出Transformer模型,舍弃以往在seqtoseq上使用性能较好RNN变体,完全依赖于attention机制
2017年,谷歌发表Massive Exploration of Neural Machine Translation Architectures,该篇论文用实验来分析神经网络翻译模型中哪些模块在真正地起作用

后续内容

以2014年由谷歌和蒙特利尔大学提出的神经机器翻译出发,通过梳理相关论文来理解不同翻译模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值