深度学习算法之CNN、RNN、LSTM公式推导

整个推导过程首先一定对网络的结构有清醒的认知,所有变量的下角标都能一一对应到网络结构上;然后就是链式求导了。

一、CNN公式推导

1、前向传播

假设CNN共三层,第一层为输入层,第二层为隐藏层,第三层为输出层。

定义:第一层与第二层之间的参数为Wih,第二层到第三层的参数为Whk

t时刻的某一个神经元的输入为bi

那么隐藏层输入为:

mi=1Wihbi

则隐藏层的真实输入为:

ah=mi=1Wihbi

经过激活函数后:

bh=f(ah)

再传入输出层:

ak=Kh=1Whkbh

如果最后的损失函数使用softmax的负log函数:

yk=eakm1eai

L(w)=mk=1zklog(yk)

2、反向梯度计算

先求最后的输出层的梯度:

求解参数whk关于损失函数的梯度:

L(w)whk=L(w)akakwhk=L(w)akbh(1)

L(w)ak是输出层的输入关于损失函数的导数,因为ak与每个yk都有关系,由链式法则得其导数需求和:

L(w)ak=m1L(w)ykykak(2)

又因为:
L(w)yk=zky

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值