transforms.Resize((256, 256)),
- 操作:调整图像大小输入图像的大小调整为256x256像素。
transforms.RandomHorizontalFlip(),
- 操作:随机水平翻转。
transforms.RandomRotation(degrees=30),
- 操作:随机旋转(在-30度到30度之间)。
transforms.ToTensor(),
- 操作:转换为张量。
以这几个为例
实例:
import matplotlib.pyplot as plt
from PIL import Image
from torchvision import transforms
# 定义数据转换
transform = transforms.Compose([
transforms.Resize((256, 256)),
transforms.RandomHorizontalFlip(),
transforms.RandomRotation(degrees=30),
])
# 加载图片
image_path = 'D:\\python_learning\\pythonProject_conda\\ceshi\\dog.jpg' # 注意路径中的反斜杠需要转义
original_image = Image.open(image_path)
# 应用转换
processed_image = transform(original_image)
# 将Tensor转换回NumPy数组以显示
processed_image = processed_image.numpy().transpose(1, 2, 0) # 将CHW转换为HWC
processed_image = (processed_image * 255).astype('uint8') # 将[0,1]范围的值转换回[0,255]
# 创建一个1行2列的子图
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
# 显示原始图片
axes[0].imshow(original_image)
axes[0].set_title('Original Image')
axes[0].axis('off') # 不显示坐标轴
# 显示处理后的图片
axes[1].imshow(processed_image)
axes[1].set_title('Processed Image')
axes[1].axis('off') # 不显示坐标轴
# 显示图片
plt.show()
输出:
这些操作通常在数据加载阶段被组合使用,以创建一个预处理流水线,对数据集中的每个图像都应用相同的预处理步骤。这样可以确保数据在输入模型之前是标准化和增强过的,有助于提高模型的性能和泛化能力。
简单来说这些变体虽然源自同一张原始图像,但由于旋转、翻转、缩放等变换,对于模型来说就像是全新的数据。