RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT),裁剪梯度只能缓解梯度爆炸,无法缓解梯度消失的问题。进而提出,
⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系
推导公式 :
• 重置⻔有助于捕捉时间序列⾥短期的依赖关系;
• 更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。
重置门和更新门
门控循环单元中的重置门和更新门的输⼊均为当前时间步输⼊X_t与上⼀时间步隐藏状态 ,输出由激活函数为sigmoid
函数的全连接层计算得到。

候选隐藏状态

RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT),裁剪梯度只能缓解梯度爆炸,无法缓解梯度消失的问题。进而提出,
⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系
推导公式 :
• 重置⻔有助于捕捉时间序列⾥短期的依赖关系;
• 更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。