通过时间反向传播
从 t=1t=1 到 t=τt=τ 应用如下更新方程:
a(t)=b+Wh(t−1)+Ux(t)a(t)=b+Wh(t−1)+Ux(t)
h(t)=tanh(a(t))h(t)=tanh(a(t))
o(t)=c+Vh(t)o(t)=c+Vh(t)
y^(t)=softmax(o(t))y^(t)=softmax(o(t))
设损失函数L(t)L(t)为给定x(1),...,x(τ)x(1),...,x(τ)后 y(t)y(t)的负对数似然,则:
L(x,y)=−∑tlogpmodel(y(t)|{ x(1),...,x(τ)})L(x,y)=−∑tlogpmodel(y(t)|{ x(1),...,x(τ)})
=−logexp(o(t)y(t))∑iexp(o(t)i)=−logexp(oy(t)(t))∑iexp(oi(t))
=−logy^(t)=−logy^(t)
其中ii为