鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
AI同传领域又有新进展,这次突破来自百度。
百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音的机器同传系统:DuTongChuan(度同传)。

该系统基于百度飞桨PaddlePaddle平台开发,可以实时地翻译演讲内容并以语音播报的形式传递给观众。
在最新提交的论文(见传送门)结果中:

汉译英准确率85.71%,英译汉准确率86.36%。
并且PK 3位经验丰富的人类同传译员,最终结果极具竞争力,在评估所用的BLEU和人工评价双重评价中,度同传均达到与人类专员媲美的水平。
论文中还介绍,该系统已成功应用于百度2019开发者大会,将演讲内容实时地翻译给现场观众收听。现场反馈,延时大多不到3秒。
与传统的字幕投屏同传相比,算得上是真正的沉浸式体验,如同人工同传一般。
百度方面介绍,度同传系统,能够实现语音到语音的机器同传,其中核心技术所在,是全球首个上下文感知机器同传模型。
具体原理如何,我们结合论文解析一二。
三大秘籍
一个人类同声传译人员,在进行翻译的时候会把听到的内容划分成一个一个语义块,对一段话进行理解翻译,既不是逐字翻译,也不是逐句翻译,这样既能保证语义不变,又能保证实时性。
百度翻译团队由此得到灵感,教给度同传同声传译秘籍第一招:

百度机器翻译团队推出了全球首个上下文感知的机器同传模型——DuTongChuan,该系统在汉译英和英译汉的准确率上表现出色,并在与3位人类同传译员的对比中,达到了媲美人类的水平。DuTongChuan基于语义信息单元、创新解码算法和BSTC数据集,实现了语音到语音的实时翻译,已应用于百度2019开发者大会。
最低0.47元/天 解锁文章
108

被折叠的 条评论
为什么被折叠?



