接着上一篇 Google 阵营Tensorflow /Keras为我们提供了大量pre-trained经典卷积网络模型, 这一篇继续介绍Pytorch如何使用Pytorch torchvision.models中的经典模型进行快速迁移学习。
相比Tensorflow主要多了Facebook团队发布的 SqueezeNet、ShuffleNet、Wide ResNet、MNASNet模型。
torchvision.models
Pytorch一共提供29个经典卷积神经模型

Pytorch官网TORCHVISION.MODELS
迁移学习代码实现
迁移学习十分简单,直接使用torchvision.models.Xnet去掉最后一个modul便可以实现。
import torchvision
base_model=torchvision.models.alexnet(pretrained=False)
model = nn.Sequential(*list(trained_model.children())[:-1],
Flatten(),
nn.Linear(512, 5)
).to(device)
optimizer = optim.Adam(model.parameters(), lr=1e-3)
criteon = nn.CrossEntropyLoss()
另外,Pytorch十分方便的地方是所有模型的源代码可以直接从官网推荐中进行拷贝,比如,点击SOURCE,便可以得到Alexnet的源代码和预训练权重文件地址
torchvision.models网址

import torch
import torch.nn as nn
# load_state_dict_from_url加载地址替换为torch.hub
#from .utils import load_state_dict_from_url
try:
from torch.hub import load_state_dict_from_url
except ImportError:
from torch.utils.model_zoo import load_url as load_state_dict_from_url
__all__ = ['AlexNet', 'alexnet']
model_urls =

本文介绍了Pytorch中torchvision.models模块的使用,特别是利用预训练模型进行迁移学习。文章详细讲解了SqueezeNet、ShuffleNet、Wide ResNet和MNASNet等模型的背景、网络结构、结果和讨论。SqueezeNet通过创新的fire模块实现高效压缩,ShuffleNet则引入pointwise group convolution和channel shuffle增强信息交流。这些模型在保证精度的同时,减少了参数量和计算复杂度,适合移动端和嵌入式设备。
最低0.47元/天 解锁文章
1162

被折叠的 条评论
为什么被折叠?



