学习笔记:RNN与LSTM
记录一下学习进度吧。
RNN
Recurrent Neural Network偏重于数据时序上的处理,是一个链式的结构。由于RNN中存在时间上的信息,就可以根据之前出现的信息对当前的信息进行推断,链式的特征揭示了 RNN 本质上是与序列和列表相关的。他们是对于这类数据的最自然的神经网络架构。这可能就是它最大的优势吧。
但是类似于梯度衰减和梯度爆炸,但信息相隔时间过晚,会存在信息遗忘的情况,无法体现优势。
RNN前向传导公式示意
st=tanh(Uxt+Wst−1) s t = t a n h ( U x t + W s t − 1 )
ot=sof