torchvision 数据加载和可视化：ImageFolder、make_grid

最新推荐文章于 2024-12-30 20:15:03 发布

原创

最新推荐文章于 2024-12-30 20:15:03 发布 · 2.8k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#ImageFolder #make_grid #torchvision #可视化

本文介绍使用PyTorch框架下的torchvision工具包进行图像处理的方法。内容涵盖图像转换、数据集加载、图像分类及数据可视化等关键步骤，并提供实际代码示例。

torchvision 是 pytorch 框架适配的相当好用的工具包，它封装了最流行的数据集（torchvision.datasets）、模型（torchvision.models）和常用于 CV 的图像转换组件（torchvision.transforms）和其它工具：

有时间一定要通读一遍官方文档 TORCHVISION，内容不多，简明易懂，有助于上手。

以 notebook 的方式实践 torchvision

# 导入必要的包
import torch
import torchvision
from torch import nn, optim
from torch.utils.data import DataLoader
from torchvision import models, datasets, transforms

%pylab inline  # 魔法方法用于显示 plt.show()

一、`torchvision.transforms`

用 transforms.Compose([ ... ]) 定义常用的图像转换流程，以字典的方式保存方便调用：

# 按照数据集的图像大小选择转换组件和参数
data_transforms = {
   
   
    # 训练数据集的转换组件
    'train': transforms.Compose([
        transforms.Resize(230),  # 图片自适应缩小（或放大）到最大边长为230的大小 == transforms.Scale(230)
        transforms.CenterCrop(224),  # 居中裁剪成 224×224的图
        transforms.RandomHorizontalFlip(p=0.5),  # 随机水平翻转图像，图像被翻转的概率默认为 p=0.5
        transforms.ToTensor(),