反向传播(BPTT)与循环神经网络(RNN)文本预测

最新推荐文章于 2025-10-22 15:22:44 发布

原创

最新推荐文章于 2025-10-22 15:22:44 发布 · 8.2k 阅读

·

15

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#BPTT #RNN #文本预测

本文详细介绍了BPTT（反向传播通过时间）算法在RNN（循环神经网络）中的应用，用于文本预测。讨论了RNN的基本结构，前向传播，误差计算以及权重偏导数的求解。还提到了RNN在处理长序列依赖时的梯度消失或爆炸问题，并探讨了解决策略，如使用ReLU激活函数和LSTM/GRU单元。文中给出了实际的文本预测操作步骤，包括数据预处理、RNN模型的实现和训练。

反向传播(BPTT)与循环神经网络(RNN)文本预测

BPTT 与 RNN文本预测

参考博客：

参考论文：
- A guide to recurrent neural networks and backpropagation

本文介绍简单Recurrent Neural Networks(RNN)的基本训练算法BACKPROPAGATION THROUGH TIME (BPTT)，并用 python2.7 实现RNN的文本预测。

1. RNN训练方法：BACKPROPAGATION THROUGH TIME (BPTT)

基本RNN结构如下所示：

简单的RNN

$s_t$ 是 $t$ 时刻的隐藏状态，它表示网络的记忆单元，由前一时刻的隐藏状态和当前时刻的输入来确定， $o_t$ 表示 $t$ 时刻的输出，它与隐藏状态有关：

$s_t$ = $f(Ux_t+Ws_{t−1})$ ，假定 $f$ 为 $tanh$ 。
$o_t=g(Vs_t)$ ，假定 $g$ 为 $softmax$ 函数。

$U,W,V$ 分别是输入与隐藏状态、先前隐藏状态与当前隐藏状态、隐藏状态与输出之间的连接权重，可分别叫做输入权重、循环权重、输出权重。

BPTT与传统的反向传播算法基本相同，包含如下三个步骤：
(1) 前向传播计算输出 $o$ 和隐藏状态 $s$ ；
(2) 反向传播计算误差 $\delta$ ，表示模型目标函数 $E$ 对加权输入 $net_t=(Ux_t+Ws_{t−1})$ 的偏导；(不同的是，在BPTT中， $\delta$ 的传播沿两个方向，分别为从输出层传递至输入层，以及沿时间 $t$ 反向传播)
(3) 求解模型目标函数 $E$ 对权重 $U,W,V$ 的偏导数。

(1) 前向计算

利用如下两式从输入层 $x_t$ 计算每层的隐藏状态 $s$ 和输出 $o$ 。
$s_t$ = $f(Ux_t+Ws_{t−1})$ ，假定 f

最低0.47元/天解锁文章

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。