PyTorch图像预处理包torchvision.transforms

原创

已于 2023-08-26 13:32:03 修改 · 256 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #人工智能 #深度学习

于 2023-08-25 17:59:40 首次发布

本文详细介绍了PyTorchtorchvision库中的数据预处理工具，包括图像裁剪（如随机裁剪、中心裁剪和长宽比裁剪）、翻转（水平和垂直）、变换（标准化、填充和颜色调整）等，以及如何在实际项目中操作这些功能。

一概述

torchvision包主要由3个子包组成：

torchvision.datasets：可以用来生成图片和视频数据集；
torchvision.models：导入预训练模型；
torchvision.transforms：图像预处理。

其中 torchvision.transforms中有三大类：

 1.裁剪
  
 	- 中心裁剪:transforms.CenterCrop
 	- 随机裁剪：transforms.RandomCrop
	- 随机长宽比裁剪：transforms.RandomResizedCrop
	- 上下左右中心裁剪：transforms.FiveCrop
	- 上下左右中心裁剪后翻转，transforms.TenCrop

————————————————

 2.翻转
 
    - 依概率p水平翻转：transforms.RandomHorizontalFlip(p=0.5)
 	- 依概率p垂直翻转：transforms.RandomVerticalFlip(p=0.5)
	- 随机旋转：transforms.RandomRotation

————————————————

	 3.变换
 
    - 标准化：transforms.Normalize
 	- 填充：transforms.Pad
	- 修改亮度、对比度和饱和度：transforms.ColorJitter 
	- 转灰度图：transforms.Grayscale 
	- 线性变换：transforms.LinearTransformation() 
	- 仿射变换：transforms.RandomAffine 
	- 依概率p转为灰度图：transforms.RandomGrayscale 
	- 将数据转换为PILImage：transforms.ToPILImage

二实操

示例图片：(300, 500, 4)
在这里插入图片描述
加载图像

   import matplotlib.pyplot as plt
   from PIL import

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努力当总裁的郭琛予

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

pytorch十一：计算机视觉工具包：torchvision

qq_24946843的博客

04-22

804

计算机视觉是深度学习中最重要的一类应用，为了方便研究者应用，pytorch专门开发了一个视觉工具包torchvision。可通过pip install torchvision安装。 torchvision主要包含以下三部分：模型加载 models：提供深度学习中各种经典网络结构及与训练好的模型，包括Alex-Net、VGG系列、ResNet系列、Inception系列等。...

【Pytorch实战教程】PyTorch图像预处理全攻略：手把手拆解torchvision.transforms

若北辰

02-09

381

transform=train_transform # 自动应用预处理关键要点回顾预处理流程需要同时考虑数据规范化和多样性Compose如同流水线，顺序影响最终效果（推荐顺序：几何变换→色彩变换→Tensor转换→归一化）始终通过可视化验证预处理效果希望这篇详解能让您真正掌握transforms的精髓！如有更多问题，欢迎在评论区展开讨论～

1 条评论您还未登录，请先登录后发表或查看评论

torchvision包

qq_35027690的博客

11-09

785

torchvision 该包的主要功能是实现数据的处理，导入和预览等.如果需要对计算机视觉的相关问题进行处理，就可以借用torchvision包中提供的大量的类来完成相应的工作。torchvison包括下面四个部分。 (1).torchvision.datasets:加载图片视频等数据集 (2).torchvision.transforms:常见的图像转换工具，如随机裁剪、旋转等 ...

【神经网络】 torchvision包构建卷积神经网络实战

最新发布

大雨的博客

09-16

958

在本次探索中，我们深入领略了卷积神经网络（CNN）在计算机视觉领域的核心地位与强大能力，它就像一位神奇的艺术家，能够从纷繁复杂的图像数据中提取出独特而关键的特征，让计算机也能像人类一样 “看懂” 图像。而 torchvision 包作为基于 PyTorch 开发的计算机视觉工具包，为我们开启了实现卷积神经网络的便捷之门，它是这场技术之旅中不可或缺的得力助手。

torchvision 包的介绍

weixin_50670833的博客

04-24

1259

torchvision 是PyTorch中专门用来处理图像的库。这个包中有四个大类。 torchvision1.torchvision.datasets2.torchvision.models3.torchvision.transforms裁剪（Crop）翻转和旋转（Flip and Rotation）图像变换（resize）transforms.Resize对transforms操作，使数据增强更灵活4.torchvision.utilsmake_gridtorchvision.utils.save_im

视觉工作包torchvision

WeiXy的博客

09-15

273

视觉工作包torchvision主要包含一下三个部分： models ：提供深度学习中各种经典的模型及网络结合，包括AlexNet、VGG系列、ResNet系列、Inception系列等 dataset ：提供常用的数据集加载，继承torch.utis.data.Dataset transforms ：提供常用的数据预处理操作 torchvision还提供了两个常用函数 make_grid,它...

torchvision.transforms图像预处理常用方法简介

https://www.hyperplasma.top

06-15

2117

transforms是在计算机视觉工具包torchvision下的包，常用于对图像进行预处理（如裁剪、翻转和旋转、图像变换……），提高泛化能力。

Pytoch之torchvision.transforms图像变换实例

09-18

在PyTorch中，`torchvision.transforms`是一个非常重要的模块，它提供了许多处理图像的转换方法，用于数据预处理和增强。这些变换对于训练深度学习模型尤其关键，因为它们能够帮助模型更好地泛化，提高其在未知数据...

PyTorch图像预处理全解析（transforms）

wyy202206174248的博客

07-17

1551

PyTorch的torchvision.transforms模块是计算机视觉任务中的核心工具，提供了丰富的图像预处理和数据增强方法。该模块包含基础变换（尺寸调整、裁剪、翻转）、颜色空间变换（颜色抖动、灰度化）和数据标准化等功能，支持通过Compose组合多个变换。在训练阶段通常使用随机增强策略（如RandomResizedCrop、ColorJitter）提升模型泛化能力，而验证阶段则采用简单预处理（Resize、CenterCrop）。关键操作包括ToTensor转换和Normalize标准化，其中标准化

torchvision 包详解

shang_bo_liang的博客

03-09

379

torchvision 包的介绍_造未来-优快云博客_torchvision

torchvision.zip

03-28

torchvision-0.5.0-cp27-cp27mu-manylinux1_x86_64.whl

PyTorch 笔记（20）— torchvision 的 datasets、transforms 数据预览和加载、模型搭建（torch.nn.Conv2d/MaxPool2d/Dropout）

热门推荐

wohu1104的专栏

08-07

1万+

计算机视觉是深度学习中最重要的一类应用，为了方便研究者使用，PyTorch 团队专门开发了一个视觉工具包torchvision，这个包独立于 PyTorch，需通过 pip instal torchvision 安装。 torchvision 主要包含三部分： models：提供深度学习中各种经典网络的网络结构以及预训练好的模型，包括 AlexNet 、VGG 系列、ResNet 系列、Inception 系列等； datasets：提供常用的数据集加载，设计上都是继承 torch.utils.data

Pytorch:torchvision包-总结

qimo601的专栏

03-25

1950

TORCHVISION官网地址：torchvision — Torchvision 0.12 documentation 计算机视觉是深度学习中最重要的一类应用，为了方便研究者使用，PyTorch团队专门开发了一个视觉工具包torchvion，这个包独立于PyTorch，需通过pip instal torchvision安装。在之前的例子中我们已经见识到了它的部分功能，这里再做一个系统性的介绍。torchvision它是一个视觉工具包，提供了很多视觉图像处理的工具，主要包含三部分： datasets..

pytorch-模型训练常用的torchvision包。关于数据、模型、数据增强、优化器、损失函数。用官方的实现，自定义模型训练

白水空空

03-03

744

对于图像任务，创建了一个包 `torchvision`，它包含了处理一些基本图像数据集的方法。这些数据集包括 Imagenet, CIFAR10, MNIST 等。除了数据加载以外，`torchvision` 还包含了图像转换器， `torchvision.datasets` 和 `torch.utils.data.DataLoader`。

深度学习图像处理库TorchVision安装包使用指南

weixin_42602726的博客

09-22

1517

本文还有配套的精品资源，点击获取简介：TorchVision是PyTorch框架下的一个核心组件，用于图像处理和计算机视觉任务。最新版本的TorchVision安装包"torchvision-0.11.0+cu111-cp37-cp37m-linux_x86_64.whl"专为Python 3.7环境和CUDA 11.1优化。该库提供了经典数据集、预训练模型、数据预处理工...

torch_vision(一):数据增强和转换模块torchvision.transforms

tony365的博客

10-19

2837

torchvision包含了很多通用的数据集，模型架构，以及图像转换方法，配合pytorch使用更好搭建训练模型。

解决方案：2024年Pytorch（GPU版本）+ torchvision手动安装教程[万能安装方法] win64、linux、macos、arm、aarch64均适用

白洞，白色的明天在等着我们

02-04

1万+

对于深度学习新手和入门不久的同学来说，在安装PyTorch和torchvision 时经常会遇到各种各样的问题。本文介绍一种手动离线安装Pytorch方法，不用再更改镜像，不用挂代理，。

torchvision.transforms.functional和 torchvision.transforms

11-12

`torchvision.transforms`和`torchvision.transforms.functional`都是PyTorch中用于图像预处理的模块。其中，`torchvision.transforms`提供了一系列类来进行图像预处理，例如`Resize`、`RandomCrop`、`ToTensor`等，这些类可以被用于数据集的预处理。而`torchvision.transforms.functional`提供了一系列函数来进行图像预处理，例如`resize`、`crop`、`to_tensor`等，这些函数可以被用于单张图像的预处理。下面是一个使用`torchvision.transforms`进行数据集预处理的例子： ```python from torchvision import transforms transform = transforms.Compose([ transforms.Resize(256), transforms.RandomCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) dataset = MyDataset(root_dir, transform=transform) ``` 下面是一个使用`torchvision.transforms.functional`进行单张图像预处理的例子： ```python from PIL import Image from torchvision.transforms.functional import resize, crop, to_tensor, normalize img = Image.open('example.jpg') img = resize(img, (256, 256)) img = crop(img, 64, 64, 128, 128) img = to_tensor(img) img = normalize(img, mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ```

PyTorch图像预处理包torchvision.transforms

一 概述

二 实操

一概述

二实操