【自然语言处理】| 门控循环神经⽹络 GRU

RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT),裁剪梯度只能缓解梯度爆炸,无法缓解梯度消失的问题。进而提出,

⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系

  推导公式 :   

• 重置⻔有助于捕捉时间序列⾥短期的依赖关系;
• 更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。

重置门和更新门

门控循环单元中的重置门和更新门的输⼊均为当前时间步输⼊X_t与上⼀时间步隐藏状态 ,输出由激活函数为sigmoid 函数的全连接层计算得到。
 

 

候选隐藏状态

 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值