详细版【循环神经网络RNN】（邱锡鹏）

最新推荐文章于 2025-04-15 21:38:17 发布

皇皇零岁

最新推荐文章于 2025-04-15 21:38:17 发布

阅读量922

点赞数

分类专栏：机器学习文章标签： pytorch 神经网络深度学习 rnn 循环神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43232279/article/details/124394485

版权

本文详细介绍了循环神经网络RNN的原理和应用，包括延时神经网络、自回归模型NARX、RNN的结构及通用近似定理。重点讲解了LSTM和GRU的门控机制，解决长程依赖问题。还探讨了RNN的深度学习实践，如堆叠RNN和双向RNN，并提及扩展到图结构的递归神经网络和图神经网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

循环神经网络RNN

详细代码实现见同专栏下博文

给网络增加短期记忆能力的方法
- 延时神经网络：
  - 在前馈网络中的每个非输出层都添加一个延时器，记录神经元的最近几次活性值。
  - 在第 t 个时刻，第 𝑙 层神经元的活性值依赖于第 𝑙 − 1 层神经元的最近𝐾 个时刻的活性值，即 𝒉_𝑡^(𝑙) = 𝑓(𝒉_𝑡^(𝑙−1) ,𝒉_𝑡-1^(𝑙−1) , ⋯ , 𝒉_𝑡−𝐾^(𝑙−1))，其中𝒉_𝑡^(𝑙) ∈ ℝ^𝑀𝑙 表示第 𝑙 层神经元在时刻 𝑡 的活性值。
- 有外部输入的非线性自回归模型NARX
  - 自回归模型AR：用一个变量 𝒚_𝑡 的历史信息来预测自己． 𝒚𝑡 = 𝑤₀ + ∑ 𝑤_𝑘𝒚_𝑡−𝑘 + 𝜖_𝑡 ，其中𝐾为超参数，𝑤₀ , ⋯ , 𝑤_𝐾 为可学习参数，𝜖_𝑡 ∼ 𝒩(0, 𝜎² )为第𝑡 个时刻的噪声，方差和时间无关。
  - NARX是自回归模型的扩展：在每个时刻 𝑡 都有一个外部输入𝒙_𝑡，产生一个输出𝒚_𝑡，NARX通过一个延时器记录最近𝐾_𝑥次的外部输入和最近𝐾_𝑦次的输出，第 t 个时刻的输出 𝒚_𝑡 为 𝒚_𝑡 = 𝑓(𝒙_𝑡 , 𝒙_𝑡−1, ⋯ , 𝒙_{𝑡−𝐾𝑥} , 𝒚_𝑡−1, 𝒚_𝑡−2, ⋯ , 𝒚_{𝑡−𝐾𝑦} )，其中𝑓(⋅)表示非线性函数，可以是一个前馈网络，𝐾_𝑥 和𝐾_&#x

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。