10、序列建模：循环和递归网络

onion

于 2025-10-29 15:21:30 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习：从理论到实践文章标签：循环神经网络 RNN 双向RNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/onion/article/details/154591894

深度学习：从理论到实践专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

序列建模：循环和递归网络

1. 循环神经网络概述

循环神经网络（RNN）是用于处理序列数据的神经网络家族。就像卷积网络专门处理图像等网格值数据一样，RNN 专门处理值序列 (x(1), \ldots, x(\tau))。与卷积网络可以轻松扩展到处理大尺寸图像类似，RNN 能处理比非序列专用网络长得多的序列，且大多数 RNN 还能处理可变长度的序列。

从多层网络过渡到 RNN，需要利用机器学习和统计模型中的一个早期思想：在模型的不同部分共享参数。参数共享使模型能够扩展并应用于不同形式（这里指不同长度）的示例，并在它们之间进行泛化。例如，在从句子中提取特定信息时，RNN 可以共享相同的权重，而传统的前馈网络则需要为每个输入特征设置单独的参数，在句子的每个位置分别学习语言规则。

此外，还有一种在一维时间序列上使用卷积的相关思想，这是时延神经网络的基础。卷积操作允许网络在时间上共享参数，但这种共享是浅层的，输出序列的每个成员是输入序列中少数相邻成员的函数。而 RNN 以不同的方式共享参数，其输出的每个成员是前一个输出成员的函数，通过深度计算图实现参数共享。

在实际应用中，RNN 通常处理小批量的序列数据，时间步索引不一定指现实世界中的时间流逝，有时仅指序列中的位置。RNN 还可以应用于二维空间数据，甚至在处理涉及时间的数据时，网络可以有反向时间连接，只要在提供给网络之前观察到整个序列即可。

2. 展开计算图

计算图是一种形式化一组计算结构的方法，将递归或循环计算展开为具有重复结构的计算图，可实现参数在深度网络结构中的共享。

2.1 动态系统示例

考虑一个经典的动态系统形式：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。