LSTM层输出中output和hidden
定义
-
output
包含LSTM每个时间步t的输出特征, -
h_t
表示LSTM最后一层的输出特征。在单向LSTM中,output的最后一个时间步维度的输出
output[:, -1, :]
等于hidden;在双向LSTM层中,可以通过
拼接
output的最后一个时间步维度正反向的输出,来得到和hidden一样的输出。另外,注意控制nn.LSTM()中:#
batch_first=True
,将喂入LSTM的数据中batchsize维度提前,如果输入维度中batchsize已经在第一个维度,故无需设置
构建简单模型验证
构建简单模型验证
from torch import nn
class Config(object):
def __init__(self, vocab_size, embed_dim, label_num):
self.vocab_size = vocab_size
self.embed_dim = embed_dim
self.label_num = label_num
self.bidirectional = False
self.num_directions = 2 if self