神经机器翻译(NMT):原理、架构与实践
1. 神经机器翻译简介
大约在2014年,神经机器翻译(NMT)系统被引入。NMT是一种端到端的系统,它将完整的句子作为输入,进行特定的转换,然后输出对应源句子的翻译结果。与传统的机器翻译方法相比,NMT无需进行特征工程,如构建短语翻译模型和语法树,这对自然语言处理(NLP)领域来说是一个重大突破。
在短短两到三年的时间里,NMT就超越了所有其他流行的机器翻译技术。评估机器翻译系统常用的指标是BLEU分数,它表示候选翻译中与参考翻译匹配的n - 元组(如一元组和二元组)的数量。BLEU分数越高,机器翻译系统的性能越好。
以下是不同机器翻译系统的性能比较:
| 系统名称 | 类型 | 特点 |
| ---- | ---- | ---- |
| DeepL(NMT) | 纯NMT系统 | 性能与谷歌等巨头竞争 |
| Google(NMT) | 纯NMT系统 | 支持多种语言,平均表现优秀 |
| Yandex(NMT - SMT混合) | 混合系统 | 结合NMT和SMT优势 |
| Microsoft | 包含SMT和NMT | 提供多种翻译选择 |
| IBM(SMT) | 纯SMT系统 | 传统统计机器翻译 |
| Prompt(基于规则) | 基于规则系统 | 依赖规则进行翻译 |
| SYSTRAN(基于规则/SMT混合) | 混合系统 | 结合规则和统计方法 |
从这些系统的比较中可以看出,NMT系统在当前机器翻译的发展中处于领先地位。不过,在比较结果中可能存在一些偏差,例如谷歌翻译在更多语言(包括困难的翻译任务)上进行