一 概述
torchvision包主要由3个子包组成:
- torchvision.datasets:可以用来生成图片和视频数据集;
- torchvision.models:导入预训练模型 ;
- torchvision.transforms: 图像预处理。
其中 torchvision.transforms中有三大类:
1.裁剪
- 中心裁剪:transforms.CenterCrop
- 随机裁剪:transforms.RandomCrop
- 随机长宽比裁剪:transforms.RandomResizedCrop
- 上下左右中心裁剪:transforms.FiveCrop
- 上下左右中心裁剪后翻转,transforms.TenCrop
————————————————
2.翻转
- 依概率p水平翻转:transforms.RandomHorizontalFlip(p=0.5)
- 依概率p垂直翻转:transforms.RandomVerticalFlip(p=0.5)
- 随机旋转:transforms.RandomRotation
————————————————
3.变换
- 标准化:transforms.Normalize
- 填充:transforms.Pad
- 修改亮度、对比度和饱和度:transforms.ColorJitter
- 转灰度图:transforms.Grayscale
- 线性变换:transforms.LinearTransformation()
- 仿射变换:transforms.RandomAffine
- 依概率p转为灰度图:transforms.RandomGrayscale
- 将数据转换为PILImage:transforms.ToPILImage
二 实操
示例图片:(300, 500, 4)

加载图像
import matplotlib.pyplot as plt
from PIL import

本文详细介绍了PyTorchtorchvision库中的数据预处理工具,包括图像裁剪(如随机裁剪、中心裁剪和长宽比裁剪)、翻转(水平和垂直)、变换(标准化、填充和颜色调整)等,以及如何在实际项目中操作这些功能。
最低0.47元/天 解锁文章
804

被折叠的 条评论
为什么被折叠?



