RNN 公式及其推导

该博客详细介绍了如何通过时间反向传播计算循环神经网络(RNN)的梯度,包括o(t)、h(t)和其他参数的梯度。内容涵盖了从t=1到t=τ的更新方程,以及损失函数L(t)的定义。通过实例解释了在不同情况下o(t)和h(t)的梯度计算,并展示了其他参数如c、b、V、W和U的梯度计算过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

通过时间反向传播

t=1t=1t=τt=τ 应用如下更新方程:

a(t)=b+Wh(t1)+Ux(t)a(t)=b+Wh(t−1)+Ux(t)

h(t)=tanh(a(t))h(t)=tanh(a(t))

o(t)=c+Vh(t)o(t)=c+Vh(t)

y^(t)=softmax(o(t))y^(t)=softmax(o(t))

设损失函数L(t)L(t)为给定x(1),...,x(τ)x(1),...,x(τ)y(t)y(t)的负对数似然,则:

L(x,y)=tlogpmodel(y(t)|{ x(1),...,x(τ)})L(x,y)=−∑tlogpmodel(y(t)|{ x(1),...,x(τ)})

=logexp(o(t)y(t))iexp(o(t)i)=−logexp(oy(t)(t))∑iexp(oi(t))

=logy^(t)=−logy^(t)

其中ii

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值