GRU网络

最新推荐文章于 2024-12-11 14:10:15 发布

原创

最新推荐文章于 2024-12-11 14:10:15 发布 · 5.8k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#GRU网络 #LSTM #GRU模型

GRU网络

简介

随着 LSTM 在自然语言处理特别是文本分类任务的广泛应用，人们逐渐发现 LSTM 具有训练时间长、参数较多、内部计算复杂的缺点。Cho 等人在 2014 年进一步提出了更加简单的、将 LSTM 的单元状态和隐层状态进行合并的、还有一些其他的变动的 GRU 模型。将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态。GRU把LSTM中的遗忘门和输入们用更新门来替代。把cell state和隐状态ht进行合并，在计算当前时刻新信息的方法和LSTM有所不同。

GRU 模型是一种保持了 LSTM 效果、具有更加简单的结构、更少的参数、更好的收敛性的模型。GRU 模型由更新门和重置门两个门组成。

前一个时刻的输出隐层对当前隐层的影响程度由更新门控制，更新门的值越大说明前一时刻的隐层输出对当前隐层的影响越大；

前一时刻的隐层信息被忽略的程度由重置门控制，重置门的值越小说明忽略得越多。 GRU 结构更加精简，

使用LSTM的原因之一是解决RNN Deep Network的Gradient错误累积太多，以至于Gradient归零或者成为无穷大，所以无法继续进行优化的问题。GRU的构造更简单：比LSTM少一个gate，这样就少几个矩阵乘法。在训练数据很大的情况下GRU能节省很多时间。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。