机器翻译:原理、方法与发展趋势
1. 引言
机器翻译(MT)致力于将文本从源语言自动翻译成目标语言,是计算机科学领域中历史悠久的应用之一,可追溯到20世纪40年代末。尽管历经60多年的研究与发展,期间有进步也有停滞,但如今大规模应用现有MT技术已成为可能。这得益于诸多因素,如自20世纪90年代初起统计方法取得的显著科学进展、用于训练的多语言数据大量增加、开源统计系统的出现、在线系统的普及,以及用户对快速廉价翻译需求的增长。
MT的应用场景广泛。许多翻译服务提供商和机构已将其纳入工作流程,常见做法是先使用MT生成初稿,再由人工译者进行后期编辑,这能节省翻译成本和时间。此外,还有交互式MT和无需人工干预的MT应用,如公司用MT发布产品信息或翻译内部通信文件。
研究和商业环境中主要有四种MT方法:基于规则的MT(RBMT)、基于实例的MT(EBMT)、统计MT(SMT)和混合MT。
2. 历史回顾
MT的发展与计算机的发展同步。1949年,Warren Weaver提出用统计、信息论和密码学技术解决翻译问题。20世纪50年代,美国、苏联、英国和法国开展了重大项目,并在1954年进行了首次公开演示。
然而,到20世纪60年代中期,由于一些研究人员对MT进展持悲观态度,美国政府进行了评估,发布了ALPAC报告,认为MT比人工翻译慢、准确性低且成本高,短期内难以有实用价值。这导致美国政府对MT相关项目的资助大幅减少。
在欧洲和加拿大,由于对官方语言文件翻译的需求,一些项目蓬勃发展,如蒙特利尔大学的METEO系统,用于将英语天气预报翻译成法语,该系统运行了20年。
20世纪70年代,出现了一
超级会员免费看
订阅专栏 解锁全文
1181

被折叠的 条评论
为什么被折叠?



