机器翻译已经走了多远(以及它将去向何方)

转自:翻译技术速递

就在过去十年,人工智能(AI)已经让机器翻译实现了量子飞跃。今天,计算机能够以比以往任何时候都更高的准确性和效率翻译语言。但更耐人寻味的是,机器翻译是如何进化到与人类和其他技术进行共生互动的。这一新的发展使获得产品,服务和知识的途径民主化,使人们无论说什么语言都能得到他们所需要的东西。

在这篇博文中,我们来看看机器翻译的历程,它目前处于语言技术前沿的状态,以及它改造未来的潜在能力。

早期机器翻译框架

20世纪80年代末90年代初,机器翻译研究从基于规则的机器翻译(RBMT)发展到统计机器翻译(t),取得了重大进展。这种方法通过分析不同语言的平行文本之间的相似性并注意到出现的模式来工作。随着处理能力增强的更先进计算机的发布,SMT研究得到了加速。

尽管这种技术在过去几十年中经过多次迭代(基于单词的SMT,基于短语的SMT,基于语法的SMT)得到了改进,但它仍然有其局限性。例如,在单词顺序灵活的语言中,如葡萄牙语,SMT引擎很难产生准确的翻译。

今天,领先的机器翻译公司已经从SMT转向专注于神经机器翻译(NMT)所提供的巨大可能性。

机器翻译的突破时刻

2014年,一系列的研究论文彻底颠覆了机器翻译界。他们是第一篇提出神经网络可以将机器翻译提升到全新高度的学术论文。包括谷歌在内的几家领先的科技公司很快开始了工作。2016年,他们宣布了谷歌神经机器翻译系统,该系统利用了一个能够深度学习的人工神经网络,极大地提高了谷歌翻译的质量。

NMT系统利用人工输入的数据训练自己,以便逐步学习,从而提高翻译质量。NMT不涉及一堆单独设计的组件,而是构建了一个能够分析文本并产生翻译的大型网络。由于其包罗万象的性质,NMT通常比RBMT和SMT更善于识别诸如语法和单词之间的相似性之类的东西。

我们团队的几位成员在过去十年中高度参与AI和机器翻译研究,研究NMT和自然语言处理(NLP)方面的高级课题。例如,当我们的CTO CharyJoão Graca在宾夕法尼亚大学进行博士后研究时,他开发了一种新方法,允许在机器学习过程中插入描述性知识,解开了以前无法解决的问题。

就在过去几年里,谷歌的MT5,Facebook的XLM-R和M2M-100等尖端机器翻译模型通过为其他人工智能专家提供开源技术而掀起了波澜。组织现在可以为自己的特定目的和用例构建这些“预先训练的”模型。例如,Unbabel在XLM-R之上构建了翻译质量估计模型,并将我们的机器翻译研究发现贡献回AI社区。

这些在NMT和NLP方面的突破使得Unbabel发布了我们自己的神经框架OpenKiwi(开源质量估计)和COMET(跨语言优化的翻译评估度量),用于测量跨多种语言的机器翻译的准确性和质量。我们相信一家公司的进步就是所有公司的进步,这就是为什么我们选择发布OpenKiwi和COMET作为开源框架的原因。

机器翻译的质量是至关重要的,因为它决定了一个人的经验和他们对人工智能能力的看法。当机器翻译还处于初级阶段时,质量的不稳定常常使人们怀疑它是否有用处。我们很高兴有好奇心和决心的学者,科学家和工程师(包括我们自己的一些人!) 才有了今天的成就。

我们在Unbabel的工作就是帮助机器翻译发挥其全部潜力。今天,我们关注的主要领域之一是将语言翻译质量评估(QE)推向可能的最佳水平。由于OpenKiwi和COMET等技术的进步,我们的人工智能技术可以确定自己翻译的准确性。如果它认为有任何部分需要再次检查,这些单词或短语将由我们的多语言社区超过10万编辑审查。我们认为人在回路的AI是翻译质量的关键:好的AI QE让人类译者的生活变得更轻松,他们的反馈改善了向前移动的机器翻译模型。

未来:通过机器翻译增强操作

人工智能驱动,人工精炼的机器翻译技术最激动人心,最强大的应用之一是它能够帮助组织进行国际扩张。随着在线消费的增加和更多的公司寻求将其产品和服务带入新的市场,全球化的潜力是巨大的。即使在疫情持续的情况下,国际货币基金组织(IMF)最近发布的一份声明预测,2021年世界经济将以破纪录的6%的速度增长。

为了让任何组织都有能力为全球客户群提供服务,并使分散的员工队伍保持一致,我们开创了一种使用AI的新方法:语言操作(LangOps)。LangOps利用人工智能和公司技术栈中的现有工具,让任何人都可以用任何语言交流。在不久的将来,我们会看到更多的组织建立LangOps团队。这些小组将使用机器翻译技术,通过语言将客户服务,销售,营销,产品,以及全公司的其他团队连接起来。

我们很高兴能够在机器翻译的历史书写中扮演一个角色。参与这项工作,我们一直在寻找方法支持和学习其他的组织。按照这项技术的发展速度,可以肯定地说机器翻译的未来是光明的。我们迫不及待地想看看未来几年我们一起使用它的新方式。

作者留言:该文章为转载文章,原up机器翻译已经走了多远(以及它将去向何方)--翻译技术速递,如有侵权,联系删除

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值