LSTM:循环单元结构

lstm
在这里插入图片描述
在这里插入图片描述
在 LSTM 网络中,记忆单元 𝒄 可以在某个时刻捕捉到某个关键信息,并有能力将此关键信息保存一定的时间间隔.记忆单元 𝒄 中保存信息的生命周期要长于短期记忆 𝒉,但又远远短于长期记忆,因此称为长短期记忆.

在这里插入图片描述

### LSTM单元结构及工作机制 #### 1. LSTM单元结构组成 LSTM(Long Short-Term Memory)是一种特殊的循环神经网络(RNN),通过引入门控机制来解决传统RNN存在的梯度消失和长期依赖问题。LSTM的核心组成部分是一个记忆细胞(cell state),以及三个主要的门控结构:输入门(input gate)、遗忘门(forget gate)和输出门(output gate)。这些组件共同协作,决定了信息如何流入、存储和流出LSTM单元。 - **记忆细胞(Cell State)**: 这是LSTM的关键部分,负责保存长时间的信息流。它允许某些信息在整个序列中持续流动而不被修改[^2]。 - **输入门(Input Gate)**: 控制当前时间步的新信息进入记忆细胞的程度。该门由一个sigmoid层决定哪些值需要更新,并通过tanh层生成候选向量作为新状态的一部分[^4]。 - **遗忘门(Forget Gate)**: 决定前一时刻的记忆细胞中有多少信息会被丢弃。这个过程也由一个sigmoid函数完成,返回介于0到1之间的数值表示保留比例[^3]。 - **输出门(Output Gate)**: 调节从记忆细胞传递至下一时间步的状态信息。此操作先利用另一个sigmoid层筛选有用的部分再乘以前面计算得到的结果经过激活后的版本形成最终输出。 #### 2. 工作机制详解 以下是LSTM在一个时间步内的具体运作流程: 1. 首先,遗忘门会基于上一时刻隐藏状态 \(h_{t-1}\) 和当前输入 \(x_t\) 来决定要忘记的内容。这一步骤通过 sigmoid 函数实现,产生的值范围在 [0,1] 中,其中接近0意味着完全忽略旧数据,而接近1则几乎全部保留。 2. 接下来,输入门处理新的潜在变化。一方面,使用 sigmoid 层评估应该加入什么;另一方面,则借助 tanh 创建一个新的候选项 \(\tilde{C}_t\)。 3. 结合上述两者的决策结果调整内部 cell 的内容——即把之前记住的东西按一定比例舍去后再添加适当的新鲜成分进去构成最新的 memory vector \(C_t\)。 4. 最终,在确定好最新版的 cell 后,还要进一步挑选出适合公开给外界看到的那一部分内容出来成为本阶段正式对外公布的 hidden state \(h_t\)。这一环节依旧离不开 output gate 的参与,因为它不仅再次运用一次 sigmod 判断哪一部分值得展现而且还会配合先前已经过活化处理过的整体状况一起考虑得出最后答案。 ```python import numpy as np def lstm_cell(input_x, h_prev, c_prev, W_f, W_i, W_c, W_o, U_f, U_i, U_c, U_o, b_f, b_i, b_c, b_o): forget_gate = sigmoid(np.dot(W_f, input_x) + np.dot(U_f, h_prev) + b_f) input_gate = sigmoid(np.dot(W_i, input_x) + np.dot(U_i, h_prev) + b_i) candidate_value = np.tanh(np.dot(W_c, input_x) + np.dot(U_c, h_prev) + b_c) c_next = forget_gate * c_prev + input_gate * candidate_value output_gate = sigmoid(np.dot(W_o, input_x) + np.dot(U_o, h_prev) + b_o) h_next = output_gate * np.tanh(c_next) return h_next, c_next ``` 以上代码片段展示了单个LSTM单元的时间步运算逻辑,其中包括各个门的操作细节以及如何更新hidden state和cell state。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值