Recurrent Neural Network(RNN)|李宏毅

Mrtuhu

已于 2024-02-08 18:40:41 修改

阅读量1.3k

点赞数 8

文章标签： rnn 人工智能深度学习

于 2024-02-08 18:32:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_61900933/article/details/136074146

版权

有记忆的神经网络就是循环神经网络（Recurrent Neural Network）。

循环神经网络

一、循环神经网络（RNN）的引出
二、RNN工作原理
三、Long Short-term Memory(LSTM长短时记忆网络)
四、RNN怎么学习？

一、循环神经网络（RNN）的引出

1.1 槽填充（Slot Filling）

如下图，一个关键元素就是一个槽位(Slot)，从用户交互中抽取出的这个槽位对应的取值，就是填充(Filling)
下面的槽位(Slot)有两个，分别是目的地(destination)和到达时间(arrival time)

1.2 词的表示方法

1.2.1 1-of-N Encoding(独热编码)

在知道总共有几个词的情况下使用。

vector中元素数量就等于所有word的数量，对1个单词来说只需要vector中对应元素为1，其余元素都是0即可
但这种vector一点都不信息丰富（informative），任意两个vector都是不一样的，无法建立起同类word之间的联系（比如cat和dog都是动物）。

独热编码

1.2.2 Beyond 1-of-N Encoding

为独热编码增加“other”维度
Word Hashing：词向量的每一个维度表示一个序列，如果词中出现该序列则标记1

1.3 使用前馈神经网络解决槽位填充问题

按照解决多分类问题的思路使用前馈神经网络来解决槽位填充问题，但是使用前馈神经网络有一定的局限性。

输入：词向量
输出：该词属于某一槽位的概率

1.4 使用前馈神经网络存在的问题

在这里插入图片描述

如图，Taipei一词属于哪个槽位还与其上下文有关，因此解决该问题的神经网络需要具有记忆，由此引入了具有记忆的神经网络——循环神经网络(RNN)。

二、RNN工作原理

2.1 RNN直观的架构

循环神经网络相当于在全连接网络的隐藏层加入多个"memory"节点（需要赋初值），隐藏层的输出值被保存在memory中，由此完成了“记忆”的过程。

隐藏层的输入除了输入层的输入以外还包括memory中保存的数据；
隐藏层的输出除了要传播到输出层以外还会用于更新memory中的值。

其简单架构如下：
在这里插入图片描述

2.2 RNN详细的架构

在这里插入图片描述
循环网络在每一时间 $t$ 有相同的网络结构，假设输入 $x$ 为 $n$ 维向量，隐含层的神经元个数为 $m$ ，输出层的神经元个数为 $r$ ，则 $U$ 的大小为 $\times m$ 维； $W$ 是上一次 $a_{t-1}$ 的作为这一次输入的权重矩阵，大小为 $\times m$ 维； $V$ 是连输出层的权重矩阵，大小为 $\times r$ 维。而 $x_t$ 、 $a_t$ 和 $o_t$ 都是向量，它们各自表示的含义如下：

$x_t$ 是时刻 $t$ 的输入；
$a_t$ 是时刻 $t$ 的隐层状态。它是网络的记忆。 $a_t$ 基于前一时刻的隐层状态和当前时刻的输入进行计算，即

最低0.47元/天解锁文章

博客等级

码龄4年

1
原创

8
点赞

23
收藏

19
粉丝

关注

私信

热门文章

Recurrent Neural Network(RNN)|李宏毅 1346

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。