pytorch进阶---pytorch生态

原创

已于 2022-03-24 22:06:29 修改 · 3.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #python #人工智能 #图像处理

于 2022-03-24 22:06:12 首次发布

本文介绍了PyTorch中的torchvision库，包括图像预处理、数据增强、常见数据集、预训练模型及可视化方法。重点讨论了Transforms模块，如图像导入、中心切割、亮度调整、灰度转换、等比缩放、随机裁剪、水平翻转等，并阐述了如何使用Compose()组合多个变换操作。此外，还提到了pytorchVideo库在视频理解中的作用。

2.10 图像组合变化（Compose()）

3、pytorchVideo

1、torchvision

torchvision会包括我们经常处理图像一些库

(1) torchvision.tramsforms__可以用于图像预处理和数据增强（数据缩放、翻转等）

(2)torchvision.datasets__包括一些常见数据集（Fashion-MNIST、ImageNet、VOC等）

(3)torchvision.models__包括一些官方预训练模型权重（VGG、ResNet、Mobilenetv2等）

(4)torchvision.utils__提供一些可视化方法

(5)torchvision.io__视频、图像文件io操作

2、Transforms学习

2、1导入图像

import torch
import matplotlib.pyplot as plt

from torchvision.models import vgg11
from PIL import Image
import numpy as np
model = vgg11(pretrained=True)
img_path = 'C:/Users/CHDT/Desktop/cat.jpg'
img = Image.open(img_path).resize((224,224))
rgb_img = np.float32(img)/255
plt.imshow(img)

2.2 沿中心切割图像

#给定图片沿中心切割
img_centercrop1 = transforms.CenterCrop((500,500))(img)
print(img_centercrop1.size)
#对图片沿中心缩小切割，超出期望大小的部分剔除
img_centercrop2 = transforms.CenterCrop((224,224))(img)
print(img_centercrop2.size)
plt.subplot(1,3,1),plt.imshow(img),plt.title('Original')
plt.subplot(1,3,2),plt.imshow(img_centercrop1),plt.title('500*500')
plt.subplot(1,3,3),plt.imshow(img_centercrop2),plt.title('224*224')