目录:
1、基于crnn图像序列预测-pytorch代码实现——加载自己的数据集
2、基于crnn图像序列预测-pytorch代码实现——模型介绍
3、基于crnn图像序列预测-pytorch代码实现——训练过程及常见错误
在这里介绍卷积循环网络模型,包括简单的一层卷积层的conv1_LSTM,以及卷积部分迁移学习VGG和RESNET模型的VGG_LSTM,RESNET_LSTM。
关键在于层与层之间的size match,将卷积部分提取的特征作为LSTM输入的seq_len。需要注意的是,VGG网络特征层输出的尺寸都是512 * 7 * 7,所以LSTM的input_size=512 * 7 * 7
CONV_LSTM代码如下:
class ConvLSTM(nn.Module):
def __init__(self, lstm_hidden_size=256, num_lstm_layers=1, bidirectional=True):
super(ConvLSTM, self).__init__()
self.num_directions = 2 if bidirectional else 1
self.num_lstm_layers = num_lstm_layers
self.lstm_hidden_size = lstm_hidden_size
# [B, 3,