对 RNN 中 BPTT 求导过程的解析尝试

(转载一次对 RNN 中 BPTT 求导过程的解析尝试 - 知乎

其中关于雅可比的内容 参考: 学习笔记之——Jacobian matrix(雅可比矩阵)学习笔记之——Jacobian matrix(雅可比矩阵)_gwpscut的博客-优快云博客_jacobian matrix

这篇文章是本人的随笔,目的是为了记录 RNN 的 BPTT 推导过程中容易疑惑或者忽略的关键步骤。适合已熟悉 RNN 基本概念的人,因为这篇文章的内容是 “断章取义” 的,所以如果不了解基本概念可能不能顺利的将其中的符号对号入座从而影响阅读。

内容概览及相关背景知识

产生本文的契机是学习 CS224N 时,课程中通过对 RNN 的权重求导来解释梯度爆炸,如下图。本文就是对这两页 PPT 和相应 note(如下) 中求导过程的补充,主要解决两个问题: 1. 怎么推导出对权重求偏导公式,区别于其他博文的是本文不省略任何步骤,包括了关键步骤中 chain rule 应用;2. 某一 time-step 的隐藏态 h_{j} 对上一 time-step 隐藏态 h_{j-1} 的求导。

1 来自 CS224N

2 来自 CS224N

note

本文重点:两个问题

  1. 如何推导出第一页 PPT 中的:  ?
  2. 为什么  中结果是乘  而不是 [公式] ,毕竟 [公式] 时,若求 [公式] 对 [公式] 的偏导,结果写成 jacobian matrix 形式的话为 [公式] 而不是 [公式] ?

 

答案见下图,两块紫色部分是关键。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值