1. 单个RNN网络结构
输出层与普通的网络相比,多了一个回归层,将之前的信息保留进行前向的传播。
xt表示第t,t=1,2,3...步(step)的输入
st为隐藏层的第t步的状态,它是网络的记忆单元。
st=f(U*xt+W*st−1),其中f一般是非线性的激活函数
ot是第t步的输出,概率表示softmax(V*st)
权值更新:
对所存储的网络都有影响。
RNN缺点:对所以信息都进行了存储,数据没有选择性,计算量大;梯度衰减严重。基于以上缺点,提出了LSTM网络。
LSTM网络解析: