Pytorch官方教程(四)—Transfer Learning Tutorial
迁移学习主要的两种应用场景:
- 微调卷积网络:使用预训练模型初始化网络,而不是随机初始化,比如在imagenet 1000数据集上训练的网络,剩余的正常训练。
- 卷积网络作为固定的特征提取器:冻结除最后一个全连接层外所有网络的权值。最后一个全连接层被替换为一个具有随机权重的新层,并且只训练这个层。
# License: BSD
# Author: Sasank Chilamkurthy
from __future__ import print_function, division
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy
plt.ion() # interactive mode
Load Data
使用 torchvision 和 torch.utils.data 加载数据。
训练一个蚂蚁和蜜蜂分类的模型。训练图片每个类有 120 张图片。验证集每个类有 75 张图片。通常,如果从零开始训练,这是一个非常小的数据集。使用转移学习,模型会具有更好的泛化行。
这个数据集是imagenet的一个非常小的子集。
# Data augmentation and normalization for training
# Just normalization for validation
data_transforms = {
'train': transforms.Compose([
transforms.RandomResizedCrop(224),
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
'val': transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
}
data_dir = 'data/hymenoptera_data'
image_datasets = {
x: datasets.ImageFolder(os.path.join(data_dir, x),
data_transforms[x])
for x in ['train', 'val']}
dataloaders = {
x: torch.utils.data.DataLoader(image_datasets[x], batch_size=4,
shuffle=True, num_workers=4)
for x in ['train', 'val']}
dataset_sizes = {