基于crnn图像序列预测-pytorch代码实现——模型介绍

最新推荐文章于 2025-02-16 23:48:24 发布

hnu_zzt

最新推荐文章于 2025-02-16 23:48:24 发布

阅读量6k

点赞数 5

分类专栏： CRNN图像序列预测文章标签：图像序列预测卷积循环神经网络

本文链接：https://blog.youkuaiyun.com/hnu_zzt/article/details/86520584

版权

目录：
1、基于crnn图像序列预测-pytorch代码实现——加载自己的数据集
2、基于crnn图像序列预测-pytorch代码实现——模型介绍
3、基于crnn图像序列预测-pytorch代码实现——训练过程及常见错误

在这里介绍卷积循环网络模型，包括简单的一层卷积层的conv1_LSTM,以及卷积部分迁移学习VGG和RESNET模型的VGG_LSTM，RESNET_LSTM。
关键在于层与层之间的size match，将卷积部分提取的特征作为LSTM输入的seq_len。需要注意的是，VGG网络特征层输出的尺寸都是512 * 7 * 7，所以LSTM的input_size=512 * 7 * 7
CONV_LSTM代码如下：

class ConvLSTM(nn.Module):
    def __init__(self, lstm_hidden_size=256, num_lstm_layers=1, bidirectional=True):
        super(ConvLSTM, self).__init__()
        self.num_directions = 2 if bidirectional else 1
        self.num_lstm_layers = num_lstm_layers
        self.lstm_hidden_size = lstm_hidden_size
        # [B, 3,