Unsupervised Machine Translation Using Monolingual Corpora Only:仅使用单语语料库的无监督机器翻译

该论文介绍了如何仅使用单语语料库实现无监督机器翻译,通过建立共享的潜在空间,使得两种语言的句子能够相互映射。模型包括去噪自动编码器和对抗性训练,通过迭代优化提升翻译质量。实验结果显示,这种方法在不同语言对的翻译任务上表现出有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文名称:Unsupervised Machine Translation Using Monolingual Corpora Only
作者: Guillaume Lample / Ludovic Denoyer /Marc Aurelio Ranzato
发表时间:2018/4/30
论文链接:https://arxiv.org/pdf/1711.00043v1.pdf
代码链接:https://github.com/facebookresearch/MUSE 以及 https://github.com/facebookresearch/fastText

发现一篇很详细的翻译笔记:地址

在此仅作自己的学习笔记总结:

1 论文概述

本文目的:希望不利用平行语料库实现机器翻译,本文提出的模型,仅需要两个语种各自的单语种语料数据集,并将2者映射到同一隐空间中。模型主要是学习通过从共享的隐特征向量空间中重建这两种语种。
模型的两个原则:第一个原则:这个模型必须能够从一个带噪声的输入中重建出一个给定语种的句子,如标准去噪自动编码器。第二个原则:该模型能够在目标域中对带有噪声的翻译句子重建出源句,反之亦然。
模型重要思想:关键思想是在两种语言(或领域)之间建立共同的潜在空间,并通过根据两个原则在两个领域中进行重构来学习翻译:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值