29、深入理解顺序模型:GRU与LSTM的探索

深入理解顺序模型:GRU与LSTM的探索

1. GRU模型详解

1.1 候选隐藏状态的计算

GRU在每个时间步t,首先使用tanh激活函数,以当前输入 (x_{t}) 和前一隐藏状态 (h_{t-1}) 为输入来计算候选隐藏状态 (\hat{h} {t}),公式如下:
(\hat{h}
{t}= \tanh(W_{h}[h_{t-1}, x_{t}] + b_{h}))
这里的 (\hat{h}_{t}) 就是隐藏层的候选值。与传统RNN计算隐藏状态的方式类似,但GRU引入候选隐藏状态为后续决策提供了更多灵活性。

1.2 更新门的引入

传统RNN中,每个时间步计算出的隐藏值会自动成为记忆单元的新状态。而GRU通过“更新门”(有时也称为“重置门”)带来了更细致的处理方式。更新门的作用是评估候选隐藏状态 (\hat{h}_{t}) 中的信息是否足以更新记忆单元的隐藏状态,还是让记忆单元保留前一时间步的旧隐藏值。

更新门由一个sigmoid层实现,输入为当前输入和前一隐藏状态,输出是一个介于0和1之间的值 (\Gamma_{u}),计算公式为:
(\Gamma_{u} = \text{sigmoid}(W_{u}[h_{t-1}, x_{t}] + b_{u}))
当 (\Gamma_{u}) 接近1时,更新门打开,选择 (\hat{h} {t}) 作为新的隐藏状态;当 (\Gamma {u}) 接近0时,更新门关闭,保留旧的隐藏状态。

1.3 隐藏单元的更新

在某一时间步,下一个隐藏状态 (h_{t}) 由以下

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值