个人总结：从RNN（内含BPTT以及梯度消失/爆炸）到 LSTM（内含BiLSTM、GRU）Seq2Seq Attention

yyhhlancelot

于 2019-10-11 16:19:04 发布

阅读量5.2k

点赞数 12

CC 4.0 BY-SA版权

分类专栏：深度学习自然语言处理文章标签： RNN BPTT Attention Model

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yyhhlancelot/article/details/102502355

前言

RNN擅长解决的问题是连续的序列，且序列的长短不一，比如基于时间的序列：一段段连续的语音等。这些序列比较长，且长度不一，比较难直接拆分成一个个独立的样本通过DNN/CNN进行训练。

而RNN由于其独有的结构和优势，能够处理DNN/CNN所不能及的问题。

RNN的5种不同架构

声明：下列图中的方块或者圆圈都代表一个向量。

one2one:

一个输入对应一个输出。

one2many:

这里是只在序列开始进行输入计算

这种结构是把X作为每个阶段的输入

一个输入对应多个输出，这个架构多用于图片的对象识别，即输入一个图片，输出一个文本序列（来阐述这个图片）。

many2one:

多个输入对应一个输出，多用于文本分类或视频分类，即输入一段文本或视频片段，输出类别。

N2N

这是最经典的RNN结构

从这里可以看出，它要求序列的输入输出是等长的。

N2M / Encoder-Decoder / Seq2Seq：

这种结构是RNN最重要的一个变种，广泛用于机器翻译，输入一个文本，输出另一种语言的文本。文本摘要，输入一段文本序列，输出这段文本序列的摘要序列。阅读理解，将输入的文章以及答案分别进行编码，最后再对其进行解码得到答案。语音识别，输入语音信号，输出的是文字序列。这里已经没有N2N序列等长的要求，在后面会进一步对该种模型进行阐述。

RNN模型与前向传播

RNN是基于序列的，它对应的输入为对应的样本序列 $x$ 中的时间步t对应的 $x^{(t)}$ 。而 $h^{(t)}$ 代表t位置的隐藏状态，由 $x^{(t)}$ 和t-1位置的隐藏状态 $h^{(t-1)}$ 决定。

主流模型如下图

这些循环使RNN可以被看做同一个网络在不同时间步的多次循环，每个神经元会把更新的结果传递到下一个时间步。这就是RNN的正向传播，依次按照时间的顺序计算一次即可。

$x^{(t-1)}$ 和 $x^{(t-1)}$ 分别代表序列时间步t-1和t+1时训练样本的输入。

对任意一个序列时间步t，隐藏状态 $h^{(t)}$ 由 $x^{(t)}$ 和 $h^{(t-1)}$ 得到：

$h^{(t)} = f(z^{(t)})=f(Wh^{(t-1)} + Ux^{(t)} + b)$ .................................... (0)

$f$ 为激活函数，这里一般为tanh或者Relu，b为偏置。这个公式就可以理解为

$h^{(t)} = f(InputNow + MemoryPast)$ ，现有的输入＋过去的记忆，也正是由于这个，使RNN具有了记忆能力。

这里处采用Pascanu等人的论文On the difficulty of training Recurrent Neural Networks中的定义，即认为

$h^{(t)} = Wf(h^{(t-1)}) + Ux^{(t)} + b$ ........................................ (1)

这两种方法其实是等价的，只是前一种表述把隐层状态定义成激活后的值，后一种表述把隐层定义成激活前的值，这里采用后一种方式是因为它稍微好算一点。

U：输入层到隐藏层直接的权重

W：隐藏层到隐藏层的权重

V：隐藏层到输出层的权重

U，W，V这三个矩阵是模型的线性关系参数，在整个RNN网络的每一步中是共享的，也正是因为共享，才体现了RNN模型的“循环反馈”的思想。

输出 $o^{(t)}$ 的表达式比较简单：

$o^{(t)} = Vh^{(t)} + c$

最终在时间步t时我们预测输出为：

$\widehat{y}^{(t)} = g(o^{(t)})$

通常RNN是分类模型，所以这里的激活函数 $g$ 一般是softmax/sigmoid。

误差函数 $f_{e}$ 可以量化模型当前损失，比如交叉熵损失函数或平方误差，即

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。