『RNN 监督序列标注』笔记-第四章 LSTM(Long Short-Term Memory)
标准 RNN 在实际使用中能够有效利用的上下文范围很有限,这是由于经过若干次迭代,隐含层权重值要么消失要么爆炸。Long Short-Term Memory (LSTM)结构解决了这一问题。
网络结构
LSTM 具有记忆单元,每个单元含有记忆细胞和3个倍增单元(输入、输出以及遗忘门)。如图所示:
展示了一个 LSTM 网络结构,包含4个输入,5个输出,2个 LSTM 记忆细胞。
预处理的影响
LSTM 用于解决长时间范围上下文信息,如果能够找到从长时间范围依赖信号到短时间范围依赖信号之间的转换关系,就没有必要使用 LSTM,可以直接使用隐马尔科夫模型。
网络公式
脚标 ι,ϕ,ω 分别代表输入、遗忘和输出门。 wij 是从 i 到
前向过程
输入门