循环序列模型-2

阿苏尔

于 2018-04-28 16:18:11 发布

阅读量149

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u010132497/article/details/80136481

机器学习专栏收录该内容

35 篇文章

订阅专栏

本文介绍如何使用递归神经网络(RNN)构建语言模型，包括文本预处理、词汇标记化及模型训练等关键步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文来自于网易云课堂

语言模型和序列

在NLP中，构建语言模型是最基础也是最重要的工作之一，并且能用RNN很好的实现。所以，什么是语言模型呢？语言模型所做的就是它会告诉你某个特定的句子出现的概率是多少。
那么如何建立一个语言模型呢？你首先需要一个训练集，包含一个很大的英文文本语料库或者其他的语言的语料库。语料库是NLP的一个专有名词，意思就是很长的或者说是数量众多的英文句子组成的文本。假如说你在训练集中得到这么一句话，“cats average 15 hours of sleep a day” ，你要做的第一件事就是将这个句子标记化，意思就是建立一个字典，然后将每个单词都转换成对应的one-hot向量，也就是字典中索引。可能还有一件事是要定义句子的结尾，一般的做法是定义一个额外的标记EOS，另外这里忽略了标点符号的标记。另外还有一个问题，如果你的训练集中有一些词并不在你的字典中，这种情况下你可以将其替换为UNK，其代表未知词的标记。完成标志化的句子以后，下一步我们要构建一个RNN来构建这些序列的概率模型。

博客等级

码龄12年

106
原创

172
点赞

684
收藏

231
粉丝

关注

私信

热门文章

分类专栏

传感器 1篇
Matlab 3篇
书籍 2篇
硬件 3篇
C# 4篇
CFD 31篇
机器学习 35篇
DSP 3篇
嵌入式系统 12篇
python 36篇
数据结构与算法 18篇
杂记 1篇
linux
openCV
QT

展开全部收起

上一篇：: 循环序列模型-1

下一篇：: Altium Designer 初学笔记

最新评论

【转载】CFD新手应当了解的一些事情
cancana_: 有一个疑问，既然结果取决于理论功底，那为什么说理论学习不重要呢
使用matlab进行三角函数拟合
mlxyzzz: 谢谢大佬！我一直在管理器里搜cftool，没搜到原来是curve fitting
使用matlab进行三角函数拟合
Bosie的码头: 你可以在Matlab首页点击顶部的APP，然后看一下有没有下过Curve Fitting（曲线拟合器），没有的话，点击获取更多App，跳转到“附加功能资源管理器”的页面，搜索Curve Fitting，找到后点击安装，再次启动matlab就可以在APP里找到并使用了。
【小白的CFD之旅】25 二维还是三维
m0_55181290: 小牛师兄怎么回答的呀？
使用matlab进行三角函数拟合
mlxyzzz: 请问2021版本是不是没有cftool工具箱？我找了很久没找到

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。