写给新手看的机器学习原理--基于机器翻译

最新推荐文章于 2024-06-22 15:56:39 发布

LucyGill

最新推荐文章于 2024-06-22 15:56:39 发布

阅读量5.8k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：理论机器学习文章标签：机器学习机器翻译小白新手

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LucyGill/article/details/69665276

本文以新手可理解的方式介绍了机器翻译的基本原理，包括将源语言转化为词向量、学习转换规则（训练模型）、避免过拟合、模型测试及训练集、验证集和测试集的使用。深度学习在其中扮演了重要角色，尤其是RNN和LSTM在处理语言上下文信息方面的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

欢迎转载，转载请注明出处：http://blog.youkuaiyun.com/lucygill

本文基于个人理解，欢迎讨论交流。

最近在看斯坦福大学机器翻译的开源代码，琢磨着把代码稍微改动一下，做成中文到英文的翻译。参考了业界大牛的不少论文，大致明白了机器翻译实现的步骤：

1.将源文件转化成词向量（像中文这种词之间没有明显符号的，要先进行分词）

转化的方法，最简单的是生成one-hot词向量。具体来说就是，如果文件中包含n个不同的词，那么每个词的词向量都是n维的，而且只有一个元素的值为1，其余元素都为0. 这样做虽然简单，但需要的空间极大，而且无法反映出词与词之间的联系。我们想得到的词向量是这样的：舅舅-男人=舅妈，或者，王子+女人=公主。斯坦福大学的论文中是这样做的：先生成one-hot词向量，再通过一个变换矩阵将其压缩成低维向量。

注意，机器翻译是有监督学习，所以词向量的转化涉及将源语言和目标语言的文件进行词向量转化。通过转化，我们就把语言与语言之间的转换，等价变为向量与向量之间的转换。为什么要这样做呢？因为电脑本身是没有语言的概念的，它只认一串串数字。事实上，语言在电脑上的存在，也是通过ascii，Unicode等编码实现的。但我们不能直接用这些编码进行机器翻译，因为它们的规律性弱，也没法很好地展示词之间的关系，存储方式也比较复杂。机器翻译也算是一种数学模型，而数学模型的精髓就是简化问题，忽略不必要的条件。（数学系妹子的职业病==）

2.学习转换规则（训练模型）

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。