目录
1、torchvision
torchvision会包括我们经常处理图像一些库
(1) torchvision.tramsforms__可以用于图像预处理和数据增强(数据缩放、翻转等)
(2)torchvision.datasets__包括一些常见数据集(Fashion-MNIST、ImageNet、VOC等)
(3)torchvision.models__包括一些官方预训练模型权重(VGG、ResNet、Mobilenetv2等)
(4)torchvision.utils__提供一些可视化方法
(5)torchvision.io__视频、图像文件io操作
2、Transforms学习
2、1导入图像
import torch
import matplotlib.pyplot as plt
from torchvision.models import vgg11
from PIL import Image
import numpy as np
model = vgg11(pretrained=True)
img_path = 'C:/Users/CHDT/Desktop/cat.jpg'
img = Image.open(img_path).resize((224,224))
rgb_img = np.float32(img)/255
plt.imshow(img)

2.2 沿中心切割图像
#给定图片沿中心切割
img_centercrop1 = transforms.CenterCrop((500,500))(img)
print(img_centercrop1.size)
#对图片沿中心缩小切割,超出期望大小的部分剔除
img_centercrop2 = transforms.CenterCrop((224,224))(img)
print(img_centercrop2.size)
plt.subplot(1,3,1),plt.imshow(img),plt.title('Original')
plt.subplot(1,3,2),plt.imshow(img_centercrop1),plt.title('500*500')
plt.subplot(1,3,3),plt.imshow(img_centercrop2),plt.title('224*224')

2.3 图像亮度等改变
#

本文介绍了PyTorch中的torchvision库,包括图像预处理、数据增强、常见数据集、预训练模型及可视化方法。重点讨论了Transforms模块,如图像导入、中心切割、亮度调整、灰度转换、等比缩放、随机裁剪、水平翻转等,并阐述了如何使用Compose()组合多个变换操作。此外,还提到了pytorchVideo库在视频理解中的作用。
最低0.47元/天 解锁文章
4009

被折叠的 条评论
为什么被折叠?



