经典卷积神经网络(二) Pytorch torchvision.models

最新推荐文章于 2025-05-30 16:46:48 发布

老光头_ME2CS

最新推荐文章于 2025-05-30 16:46:48 发布

阅读量2.2k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Pytorch 文章标签： pytorch

本文链接：https://blog.youkuaiyun.com/Forrest97/article/details/108391901

本文介绍了Pytorch中torchvision.models模块的使用，特别是利用预训练模型进行迁移学习。文章详细讲解了SqueezeNet、ShuffleNet、Wide ResNet和MNASNet等模型的背景、网络结构、结果和讨论。SqueezeNet通过创新的fire模块实现高效压缩，ShuffleNet则引入pointwise group convolution和channel shuffle增强信息交流。这些模型在保证精度的同时，减少了参数量和计算复杂度，适合移动端和嵌入式设备。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

接着上一篇 Google 阵营Tensorflow /Keras为我们提供了大量pre-trained经典卷积网络模型，这一篇继续介绍Pytorch如何使用Pytorch torchvision.models中的经典模型进行快速迁移学习。
相比Tensorflow主要多了Facebook团队发布的 SqueezeNet、ShuffleNet、Wide ResNet、MNASNet模型。

torchvision.models

Pytorch一共提供29个经典卷积神经模型
在这里插入图片描述
Pytorch官网TORCHVISION.MODELS

迁移学习代码实现

迁移学习十分简单，直接使用torchvision.models.Xnet去掉最后一个modul便可以实现。

import torchvision

base_model=torchvision.models.alexnet(pretrained=False)
model = nn.Sequential(*list(trained_model.children())[:-1], 
                      Flatten(), 
                      nn.Linear(512, 5)
                      ).to(device)
optimizer = optim.Adam(model.parameters(), lr=1e-3)
criteon = nn.CrossEntropyLoss()

另外，Pytorch十分方便的地方是所有模型的源代码可以直接从官网推荐中进行拷贝,比如，点击SOURCE，便可以得到Alexnet的源代码和预训练权重文件地址
torchvision.models网址
在这里插入图片描述

import torch
import torch.nn as nn
# load_state_dict_from_url加载地址替换为torch.hub
#from .utils import load_state_dict_from_url
try:
    from torch.hub import load_state_dict_from_url
except ImportError:
    from torch.utils.model_zoo import load_url as load_state_dict_from_url


__all__ = ['AlexNet', 'alexnet']


model_urls =