LSTM-长短期神经网络

本文详细介绍了LSTM(长短期记忆网络),一种适用于处理序列数据的特殊RNN,通过遗忘门、输入门和输出门控制细胞状态,以解决传统RNN的梯度消失问题。LSTM的核心在于细胞状态,它通过门结构选择性地保留或遗忘信息。此外,还提及了简化版的GRU门循环单元,并讨论了多层和双向RNN的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        LSTM是特殊的RNN,尤其适合顺序序列数据的处理,内部由遗忘门、输入门和输出门组成,循环神经网络(RNNs):通过不断将信息循环操作,保证信息持续存在,从而解决不能结合经验来理解当前问题的问题。RNN和LSTM都只能依据之前时刻的时序信息来预测下一时刻的输出

 

        

图中可看出A允许将信息不断的在内部循环,这可以使其保证每一步的计算都能保存以前的信息。

把RNNs自循环结构展开,可以看成是同一个网络复制多次并连成一条线,把自身信息传递给下一时刻的自己。

为了避免RNN出现的梯度消息情况,引出了LSTM的结构如下:

 LSTM内部有四个网络层,这不同于标准RNN网络里只有一个网络层的单元。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值