【动手学习pytorch笔记】24.门控循环单元GRU

最新推荐文章于 2024-05-07 21:02:09 发布

原创

最新推荐文章于 2024-05-07 21:02:09 发布 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pytorch #深度学习 #rnn #学习 #gru

本文介绍了门控循环单元（GRU）的工作原理，作为长短期记忆网络（LSTM）的简化版，GRU通过重置门和更新门控制信息流，以选择性地记住和遗忘序列中的信息。GRU包含两个门控机制，用于学习序列中的重要特征，同时减少计算复杂性。代码示例展示了如何在PyTorch中实现GRU，并进行训练。训练结果显示，GRU在理解和实现上相对简单，且在速度上有优势。

GRU

序列中并不是所有信息都同等重要，为了记住重要的信息和遗忘不重要的信息，最早的方法是”长短期记忆”（long-short-term memory，LSTM），这节门控循环单元（gated recurrent unit，GRU）是一个稍微简化的变体，通常能够提供同等的效果，并且计算的速度明显更快。

理论

两个门（和隐藏状态类似）

重置门（虫豸们~）

$Rt=σ(XtWxr+Ht−1Whr+br)R_t = \sigma(X_tW_{xr}+H_{t-1}W_{hr}+b_r)$

更新门

$Zt=σ(XtWxz+Ht−1Whz+bz)Z_t = \sigma(X_tW_{xz}+H_{t-1}W_{hz}+b_z)$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。