RNN基本原理及梯度消失、梯度爆炸的问题原因及解决方法

一、RNN基本结构

在这里插入图片描述

1、隐层状态sts_tst

st=σ(Uxt+Wst−1+b1)s_t=\sigma(Ux_t+Ws_{t-1}+b_1)st=σ(Uxt+Wst1+b1) σ\sigmaσ()是激活函数,通常选用Tanh、ReLU。

2、输出状态oto_tot

ot=g(Vst+b2)o_t=g(Vs_t+b_2)ot=g(Vst+b2)ggg()是激活函数,对于分类任务通常选用sigmoidsigmoidsigmoid()。

3、Loss计算

输出状态oto_tot与目标输出yty_tyt计算Loss:
L=∑tLt=∑tLoss(ot,yt)L=\sum_{t}L_t=\sum_{t}Loss(o_t,y_t)L=tLt=tLoss(ot,yt)LossLossLoss是损失函数,对于分类任务通常选用交叉熵损失函数。

二、RNN参数更新方式

1、首先需要明确:上述的循环重复结构,都是共享参数的,也就是说不管在什么时刻,权重矩阵UUUWWWVVV都是相同的。

好处:极大减少参数量+可以处理不定长序列

2、梯度下降、反向传播过程

假设t=3t=3t=3的时刻,计算它的损失函数:
s3=σ(Ux3+Ws2+b1)o3=g(Vs3+b2)L3=12(o3−y3)2 s_3=\sigma(Ux_3+Ws_{2}+b_1) \\ o_3=g(Vs_3+b_2) \\ L_3=\frac{1}{2}(o_3-y_3)^2 s3=σ(Ux3+

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值