pytorch学习笔记(四)——torchvision.transforms的使用

本文详细介绍了torchvision.transforms模块在图像预处理中的作用,包括ToTensor、Normalize、Resize和Compose等关键操作。通过实例展示了如何将图片转换为tensor,进行归一化处理,调整图片大小,并组合多个变换。此外,还演示了RandomCrop随机裁剪的使用方法,以及在tensorboard中展示图像变换效果的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. transforms作用

torchvision.transforms是pytorch中的图像预处理包,包含了很多种对图像数据进行变换的函数,例如裁剪翻转旋转等操作,这些都是在我们进行图像数据读入步骤中必不可少的。

2. transform各功能的用法

  1. ToTensor
    把图片数据转换成tensor数据类型
  2. Normalize
    归一化: Normalize创建实例时要输入均值和标准差,进行归一化操作输入需要是tensor类型的图片
  3. Resize
    缩放图片大小
  4. Compose
    一个transforms的系列变化,Compose中的参数是一个列表,列表元素要是transforms类型的,即Compose([transforms1,transforms2,…])
  5. RandomCop 随机裁剪
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

# python __call__函数的使用:直接用类对象(call的参数) 即可调用call函数

writer = SummaryWriter("logs")

img = Image.open("dataset/train/ants/5650366_e22b7e1065.jpg")

# 1. ToTensor 把图片数据转换成tensor数据类型
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image("ToTensor", img_tensor)

# 2. Normalize 归一化: Normalize创建实例时要输入均值和标准差,进行归一化操作输入需要是tensor类型的图片
trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
img_norm = trans_norm(img_tensor)
writer.add_image("Normalize", img_norm)

# 3.Resize 缩放图片大小
print(img.size)
# img PIL -> resize -> img_resize PIL
trans_resize = transforms.Resize((512, 512))
img_resize = trans_resize(img)
# img_resize PIL -> totensor -> img_resize tensor (想要在tensorboard进行显示需要再变换成tensor类型)
img_resize = trans_totensor(img_resize)
writer.add_image("Resize", img_resize, 1)
print(img_resize)

# 4.Compose 一个transforms的系列变化,Compose中的参数是一个列表,列表元素要是transforms类型的,即Compose([transforms1,transforms2,…])
trans_resize_2 = transforms.Resize(512)
# PIL -> resize PIL -> tensor
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 2)

"""
理解:
1.transforms.Compose相当于调用Compose类的__init__函数,把返回的实例对象赋给trans_compose
2.trans_compose(img)相当于调用Compose类的__call__函数
"""

# 5. RandomCop 随即裁剪
# 注意这里的crop size不能大于 input image size;给一个int参数时按正方形裁剪,给一个(int, int)参数时按高宽长方形裁剪
trans_random = transforms.RandomCrop(300)
trans_compose_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)

writer.close()


transforms.GaussianBlur是torchvision库中的一个预定义的图像变换方法。它用于对图像进行高斯模糊处理,可以通过指定模糊核的大小和标准差来调节模糊程度。在提供的代码中,transform2通过transforms.Compose将自定义的AddBlur方法包装成一个预处理方法,然后使用transforms.RandomApply将其以一定的概率应用于输入图像。因此,当你需要使用transforms.GaussianBlur进行图像预处理时,可以根据需要选择合适的参数进行调用。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [torchvision.transforms:同时使用RandomApply、RandomChoice,官方预处理方法、自定义预处理方法](https://blog.csdn.net/qq_40682833/article/details/127740496)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [『PyTorch学习笔记 1 —— transforms](https://blog.csdn.net/libo1004/article/details/116673227)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值