一、【GRU网络结构解析】
GRU 是 LSTM 网络的一种效果很好的变体,它较 LSTM 网络的结构更加简单,而且
效果也很好,因此也是当前非常流形的一种网络。GRU 既然是 LSTM 的变体,因
此也是可以解决 RNN 网络中的长依赖问题。在 LSTM 中引入了三个门函数:输入
门、遗忘门和输出门来控制输入值、记忆值和输出值。而在 GRU 模型中只有两个
门:分别是更新门和重置门。具体结构如下图所示:



二、【BPTT训练公式】
BPTT(Backpropagation Through Time,递归神经网络的反向传播算法)是一种用