在 PyTorch 中,
nn.LSTM
是实现长短期记忆(Long Short-Term Memory, LSTM)网络的一个类,广泛用于处理和预测
序列数据
的任务。LSTM 是一种特殊类型的
循环神经网络
(RNN),能够学习
长期依赖
信息,这一点在普通的 RNN 中是很难做到的。
nn.LSTM 的基本介绍
nn.LSTM
对象在 PyTorch 中负责创建一个 LSTM 层
。它的参数主要包括:
input_size
:输入特征的维度。hidden_size
:LSTM 隐藏层的维度。num_layers
:堆叠的 LSTM 层的数量(默认为1层)。bias
:是否使用偏置(默认为True)。batch_first
:输入和输出的维度顺序是否为 (batch, seq, feature)(默认为False,即 (seq, batch, feature))。dropout
:如果大于0,则除了
最后一层外,其他层后会添加一个dropout层。bidirectional
:是否使用双向
LSTM(默认为False)。