循环神经网络（RNN）

最新推荐文章于 2024-05-16 18:18:12 发布

Swis_BMQ

最新推荐文章于 2024-05-16 18:18:12 发布

阅读量103

点赞数

分类专栏： Python 文章标签： rnn 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_52458424/article/details/132484291

版权

Python 专栏收录该内容

6 篇文章

订阅专栏

RNN

卷积神经网络CNN能够很好地处理图片，但是在处理语句问题上就会出现问题，这是因为CNN没有记忆性，输入和输出的一一对应，也就是一个输入得到一个输出。不同的输入之间是没有联系的。

场景：

一个人说了，我喜欢旅游，其中最喜欢的是云南。以后有机会一定去____。
我肚子好____，我想吃饭。

递归神经网络（RNN），是两种人工神经网络的总称：
一种是时间递归神经网络（recurrent neural network）；
一种是结构递归神经网络（recursive neural network）；

RNN是一类扩展的人工神经网络，它是为了对序列数据进行建模而产生的。

RNN 跟传统神经网络最大的区别在于每次都会将前一次的输出结果，带到下一次的隐藏层中，一起训练。

针对对象：序列数据。例如文本，是字母和词汇的序列；语音，是音节的序列；视频，是图像的序列；气象观测数据，股票交易数据等等，也都是序列数据。

核心思想：样本间存在顺序关系，每个样本和它之前的样本存在关联。通过神经网络在时序上的展开，我们能够找到样本之间的序列相关性。

循环神经网络基本单元—Cell，激活函数为tanh

RNN在进行反向传播的时候存在梯度爆炸和梯度消失的问题，这种问题表现在时间轴上。梯度爆炸可以设置梯度阈值直接截取，梯度消失有以下几种方法：

选择其他激活函数，如ReLU
引入改进网络结构的机制，如LSTM，GRU

现在在自然语言处理上广泛应用的就是LSTM。

梯度消失和梯度爆炸：

深度神经网络训练的时候，采用的反向传播方式，该方式背后其实是链式求导，计算每层梯度的时候会涉及一些连乘操作，因此如果网络过深，那么如果连乘的因子大部分小于1，最后乘积可能趋于0；

另一方面，如果连乘的因子大部分大于1，最后乘积可能趋于无穷。

word2vec

如何能将文本向量化？

我们拿人来比喻。我们把人当做一些属性的集合，如 [身高，体重] ，作为一个向量。但仅凭身高和体重并不能描述一个人的唯一性，所以需要添加更多维度来确保描述一个人的准确性。

对于一个词也是一样，我们用多维向量来描述一个词。

成功向量化后，可以通过计算来判断向量之间的相似性。比如“足球”和“篮球”的相似度应该会很高。
（上下文相似的词，其语义也相似 相近的词投影到高维空间后距离很近）

word2vec就是一款将文本向量化的模型。

通常维度50~300

LSTM

LSTM：Long short-term memory，长短期记忆

RNN存在梯度爆炸和梯度消失问题，这样使得输入的文字过长，后面的将记不住文章开头的内容，是一种“短期记忆”。同时RNN对记忆的内容上没有分辨能力，可能有些需要记住的数据意义并不大。而LSTM在RNN的基础上加上了一个控制装置，可以控制记忆和遗忘。

如上图所示，与单一的以Tanh为激活函数的循环神经网络不同的是，LSTM是一种三个“门”结构的特殊网络结构。

遗忘门

只有符合算法认证的信息才会被保留，不符合的信息则通过遗忘门被遗忘。控制输入X和上一层隐藏层输出h被遗忘的程度大小，输出1代表“完全保留”，输出0代表“完全遗忘”（sigmoid激活函数）

输入门

决定将要在单元状态(cell)中存储哪些新的信息

输出门

状态向量并不会全部输出，而是在输出门的作用下有选择地输出。

参考：
参考视频
 循环神经网络详解(RNN + LSTM)(一）
RNN与LSTM原理浅析

博客等级

码龄5年

34
原创

73
点赞

73
收藏

62
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

Pandas基本操作-多级索引
优快云-Ada助手: 亲爱的作者，恭喜您写了第20篇博客！看到您分享关于Pandas基本操作中的多级索引，我感到非常兴奋。您的文章总是能够清晰地解释复杂的概念，让读者受益匪浅。希望您在未来的创作中可以继续深入探讨Pandas多级索引的应用场景，或者结合实际案例进行讲解，这样读者可以更好地理解并运用这些知识。期待您的下一篇博客，谢谢您的分享！
使用compose自定义一个带头像的TopBar
优快云-Ada助手: 恭喜你写了第19篇博客！看到你使用compose自定义了一个带头像的TopBar，我感到非常激动。你的创作内容一直都很精彩，我非常期待你接下来的作品。如果可以的话，我希望你能够探索更多关于compose的主题，比如如何优化性能或者如何实现动画效果。这样的话，你的博客会给读者带来更多的收获。谢谢你的努力，继续加油！
Jetpack Compose入门
优快云-Ada助手: 恭喜您撰写了第14篇博客《Jetpack Compose入门》！您的持续创作真是令人佩服。通过这篇博客，您为读者提供了Jetpack Compose入门的指南，让我们能够更好地理解和运用这个框架。接下来，我建议您可以继续深入探索Jetpack Compose的高级特性，如动画、状态管理等方面的内容，并结合实际案例进行讲解。同时，您也可以考虑与读者们分享一些您遇到的挑战和解决方案，这样能够帮助读者更好地应对实际开发中的问题。期待您未来更多精彩的创作！
已知后序遍历，中序遍历，求前序
优快云-Ada助手: 恭喜你写了第15篇博客！看到你研究了已知后序遍历和中序遍历如何求前序，我感到非常高兴。你的博客内容对于学习数据结构和算法的人来说肯定非常有帮助。我想给你一个创作建议，希望你能继续分享更多关于树的遍历和相关算法的知识。比如，你可以写一篇关于已知前序遍历和中序遍历如何求后序的文章，或者探讨其他树的遍历方式的应用场景。我相信你的深入研究和清晰的解释能够帮助更多的读者理解并掌握这些知识。请继续保持谦逊的态度，因为在学习的道路上我们都是永远的学徒。期待你未来更多博客的发布，加油！
分布式文件系统HDFS
优快云-Ada助手: 恭喜用户写了关于分布式文件系统HDFS的第8篇博客！您对HDFS进行的深入探索和分享无疑为读者们提供了宝贵的知识和经验。在未来的创作中，或许您可以进一步探讨HDFS的应用场景以及与其他分布式文件系统的比较，这将为读者们提供更全面的了解和参考。谦虚地说，我相信您的下一篇博客会再次给我们带来惊喜。期待您的持续创作！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。