机器学习：循环神经网络

最新推荐文章于 2022-05-06 23:07:35 发布

原创

最新推荐文章于 2022-05-06 23:07:35 发布

· 590 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #循环神经网络RNN #RNN前向传播推导 #RNN反向传播推导

本文介绍了循环神经网络（RNN）的基本概念，包括其在处理序列数据上的优势。详细阐述了RNN的模型结构、前向传播算法和反向传播算法推导，以及在长序列处理时的梯度消失问题，并指出在实际应用中，LSTM是RNN的一个重要变种。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

RNN概述
RNN模型
RNN前向传播算法
RNN反向传播算法推导
RNN小结

参考文章：https://www.cnblogs.com/pinard/p/6509630.html

RNN概述

在前面讲到的DNN和CNN中，训练样本的输入和输出是比较的确定的。但是有一类问题DNN和CNN不好解决，就是训练样本输入是连续的序列,且序列的长短不一，比如基于时间的序列：一段段连续的语音，一段段连续的手写文字。这些序列比较长，且长度不一，比较难直接的拆分成一个个独立的样本来通过DNN/CNN进行训练。

而对于这类问题，RNN则比较的擅长。那么RNN是怎么做到的呢？RNN假设我们的样本是基于序列的。比如是从序列索引1到序列索引ττ的。对于这其中的任意序列索引号tt,它对应的输入是对应的样本序列中的x(t)x(t)。而模型在序列索引号tt位置的隐藏状态h(t)h(t)，则由x(t)x(t)和在t−1t−1位置的隐藏状态h(t−1)h(t−1)共同决定。在任意序列索引号tt，我们也有对应的模型预测输出o(t)o(t)。通过预测输出o(t)o(t)和训练序列真实输出y(t)y(t),以及损失函数L(t)L(t)，我们就可以用DNN类似的方法来训练模型，接着用来预测测试序列中的一些位置的输出。

RNN模型

RNN模型有比较多的变种，这里介绍最主流的RNN模型结构如下：
在这里插入图片描述
上图中左边是RNN模型没有按时间展开的图，如果按时间序列展开，则是上图中的右边部分。我们重点观察右边部分的图。

这幅图描述了在序列索引号tt附近RNN的模型。其中：

<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。