RNN循环神经网络

最新推荐文章于 2025-05-29 10:53:08 发布

cufewxy2018

最新推荐文章于 2025-05-29 10:53:08 发布

阅读量965

点赞数 29

文章标签：深度学习人工智能 RNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/cufewxy1/article/details/145986506

版权

理解本文需要读者有BPNN基础，关于BPNN可参考《BP神经网络原理》

1 概述

RNN(Recurrent Neural Network)，即循环神经网络，是用于解决序列数据的神经网络。回顾一下最基础的BPNN以及专用于图像识别的CNN，他们的输入与时间先后无关，但是有时输入的数据是序列数据，需要考虑序列中前后顺序关系的影响，此时RNN就派上用场了。

RNN是训练出固定的一套参数，接收序列当前时刻的输入以及上一时刻的输出，形成这一时刻的输出。比如用RNN做翻译，训练好模型后，给定一句话，先输入第一个词，根据模型中的权重计算出当前时刻的输出，将此输出与第二个词再次输入，得到下一时刻的输出，将此输出与第三个词输入，得到下一时刻的输出，直到整句话全部词输入完毕。

RNN相当于把序列的每次输入都展开当做隐含层，只是这些隐含层的参数是固定的。可以类比“捏陶瓷”，正常制作方法是将陶泥放在转盘上，双手在陶泥上摆出某个姿势不动，随着转盘不断旋转，陶泥360度每一个角度都变换成了理想的形状。RNN就类似于用转盘捏陶瓷，双手在陶泥上摆出固定的姿势相当于RNN中固定的参数，而使用BPNN则相当于转盘不动，双手在每一角度都捏出想要的形状，十分费时费力。

2 结构

左图是RNN未展开的形式，x是输入，W是输入层到隐含层的权重，U是隐含层上一时刻到当前时刻的权重，V是隐含层到输出层的权重，y是输出。

右图是RNN展开后的形式，将隐含层循环的过程平铺展开成多个隐含层，每个隐含层的W、U、V都一致，表示每一步都在做相同的事情。

由于每一时刻隐含层会接收上一时刻的输出，因此模型产生了“记忆”，之前时刻输入的信息也会对之后时刻产生影响。

3 计算过程

3.1 输入层到隐含层

隐含层是由输入与上一层隐含层各自乘线性变换权重相加得到。 $s_t=Wx_t+Uh_{t-1}$ ，第一时刻没有上一时刻的隐含层，则此处上一时刻的h为零向量。

隐含层经过激活函数得到隐含层的输出。 $h_t=activation(z_t)$

3.2 隐含层到输出层

输出是由隐含层输出经过V线性变换，再做softmax(如果是求概率问题，比如翻译的输出是各个词的概率)， $\hat y_t=softmax(Vh_t)$

4 梯度消失与梯度爆炸

RNN的误差反向传播算法有专有名词BPTT(Backpropagation Through Time)，但道理和BPNN是一样的。

与BPNN类似，RNN也有梯度消失与梯度爆炸的问题。当RNN循环次数过多时（相当于BPNN中隐含层过多），由于算梯度时采用链式求导法则，需要各隐含层梯度相乘，会发生梯度消失或梯度爆炸现象。

博客等级

码龄10年

33
原创

523
点赞

892
收藏

296
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 逻辑回归(Logistic)模型

下一篇：: 知识蒸馏技术

最新评论

Celery任务阻塞问题排查
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。 pip install funboost
K-Means
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
K近邻算法
优快云-Ada助手: 机器学习算法和传统的数据结构与算法有什么差异呢？
BP神经网络（BPNN）
宫淼龍: zhishu
BP神经网络（BPNN）
m0_60571919: 我想问一下用激活函数时，h1是在指数上还是直接与e乘的

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。