自然语言处理之长短时记忆网络(六)

最新推荐文章于 2024-08-13 00:39:47 发布

智享AI

最新推荐文章于 2024-08-13 00:39:47 发布

阅读量760

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：自然语言处理

本文链接：https://blog.youkuaiyun.com/guangzhanblog/article/details/110679927

35 篇文章

订阅专栏

本文深入介绍了长短期记忆网络（LSTM）的概念与结构特点，详细解释了其独特的门控机制如何帮助解决长期依赖问题，包括遗忘门、输入门及状态更新过程。此外还探讨了几种LSTM的变种。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

长短期记忆网络（LSTM，Long Short-Term Memory）是一种时间循环神经网络，是为了解决一般的RNN（循环神经网络）存在的长期依赖问题而专门设计出来的，所有的RNN都具有一种重复神经网络模块的链式形式。

区别于循环循环神经网络，LSTM最大的特点是，在更新内部记忆的时候，引入了遗忘机制，那就是：允许网络忘记一些过去阅读过程中看到的一些无关紧要的内容，只保留有用的历史内容，通过这种方式，延长了记忆长度。

4 LSTM变种

GRU有两个门，分别为更新门和重置门，即图中的zr和rt更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越少，重置门用于控制忽略前一时刻的信息的程度，重置门的值越小说明忽略的越多。