深度学习之长短期记忆网络（LSTM）的网络结构

最新推荐文章于 2025-09-15 09:00:34 发布

原创

最新推荐文章于 2025-09-15 09:00:34 发布 · 3.4k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能 #rnn

从Cell State开始

在下面的过程中，我们总是用语言模型作为例子来说明，心中始终有个具体例子对照，可以大大减轻理解上的困难。

来看这句话：“我是中国人，我会说中文”，我们的任务是根据这句话前面的内容，预测最后的两个字“中文”。要做到这一点，模型必须能够记住前面的信息，尤其是“中国人”。在LSTM中，记住前面的信息是通过Cell State来实现的。
所以，在理解LSTM的结构时，应始终以 Cell State为中心，这样就抓住了理解其结构的关键。

先来看一张LSTM的完整结构图，然后我们再来一步步从Cell State开始分析里面的内容。

完整图如下：

# Cell State的传递主线 Cell State好比一个记忆器，当你不断往cell里面输入数据时，它会不断变化，来记住之前输入的信息，这种记忆并不是机械式的，而是有选择地记忆的。下面我们就来看看它是如何选择性记忆的。

Cell State 的传递过程如下所示：

我们看到，当xt输入到Cell中后，Cell State 从Ct-1变到了Ct。

C是一个向量，向量的维度是我们自己来选择的，如果我们选256，就表示我们想要用256位来保存记忆信息，这个维度越大，相当于记忆的容量越大，可保存的信息自然越多，但是需要训练的参数也会越多。

我们看到，Ct-1到Ct共经过了两步操作，第一步是一个point wise 的乘法操作，第二步是一个point wise的加

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。