基于时间的反向传播算法BPTT（Backpropagation through time）

最新推荐文章于 2025-06-21 12:20:18 发布

原创

最新推荐文章于 2025-06-21 12:20:18 发布 · 7.1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#RNN #BPTT #深度学习 #反向传播

本文详细介绍了基于时间的反向传播算法BPTT，结合RNN网络结构，解释了如何计算V、W和U的梯度，并通过代码分析解释了算法的实现细节，包括初始化、公共部分、V的梯度和W及U的梯度的计算，同时讨论了在实际应用中对回溯长度的限制。

本文是读“Recurrent Neural Networks Tutorial, Part 3 – Backpropagation Through Time and Vanishing Gradients”的读书笔记，加入了自己的一些理解，有兴趣可以直接阅读原文。

1. 算法介绍

这里引用原文中的网络结构图
RNN
其中 $x$ 为输入， $s$ 为隐藏层状态，o为输出，按时间展开
这里写图片描述
为了与文献中的表示一致，我们用 $\hat y$ 来代替o，则
$s_t=tanh(Ux_t+Ws_{t-1}) \\ \hat y=softmat(Vs_t)$
使用交叉熵（cross entropy）作为损失函数
$E_t(y,\hat y)=-y_tlog\hat y \\ E(y, \hat y) = \sum_t E_t(y_t, \hat y_t)=-\sum_t y_tlog\hat y$
我们使用链式法则来计算后向传播时的梯度，以网络的输出 $E_3$ 为例，
$\hat y_3=\frac{e^{z_3}}{\sum_ie^{z_i}} \\ E_3=-y_3log\hat y_3=-y_3(z_3-log\sum_ie^{z_i}) \\ z_3=Vs_3 \\ s_3=tanh(Ux_3+Ws_2)$

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。