智能机器翻译系统:从基础原理到先进应用
一、机器翻译概述
机器翻译指的是利用计算机将文本从一种语言翻译成另一种语言,它是计算机语言学的一个分支,已经发展多年。目前,在美国,翻译行业规模达到400亿美元,并且在欧洲和亚洲也在快速增长。谷歌、脸书、易贝等公司在其应用中广泛使用机器翻译技术,谷歌的神经翻译系统更是能够用一个模型实现多种语言的翻译。
早期的机器翻译系统只是简单地将文本中的单词和短语翻译成目标语言中的相应替代词,但这种简单技术在翻译质量上存在局限性,原因如下:
- 源语言到目标语言的逐词映射并不总是存在。
- 即使源语言和目标语言之间存在精确的逐词映射,它们的句法结构通常也不对应,这种问题在机器翻译中被称为错位。
不过,随着循环神经网络(RNN)架构(如LSTM、GRU等)的发展,机器翻译不仅提高了翻译质量,而且系统复杂度也远低于传统系统。机器翻译系统大致可分为三类:基于规则的机器翻译、统计机器翻译和神经机器翻译。
技术要求
在深入研究机器翻译之前,你需要具备Python 3、TensorFlow和Keras的基础知识。本章的代码文件可以在GitHub上找到: https://github.com/PacktPublishing/Intelligent-Projects-using-Python/tree/master/Chapter03 。你还可以点击以下视频查看代码运行情况:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



