了解CIFAR10数据集的结构，并验证数据加载和预处理的正确性。

墨D芯

已于 2025-02-12 09:05:59 修改

阅读量865

点赞数 21

分类专栏：笔记文章标签： python 机器学习深度学习

于 2025-02-11 19:35:44 首次发布

本文链接：https://blog.youkuaiyun.com/Leaves2hours/article/details/145578370

版权

文章目录

- - 1. 模块导入与全局变量
  - 2. 主函数 `main()`
  - 3. 打印数据集基本信息
  - 4. 绘制单个样本图像
  - 5. 数据归一化
  - 6. 绘制样本网格
  - 7. 程序入口
  - 关键问题与改进建议
  - 总结

1. 模块导入与全局变量

# -*- coding: utf-8 -*-
"""
加载并显示CIFAR10数据集

PyTorch Programming & Deep Learning
@author: Mike Yuan, Copyright 2020~2021
"""

# 导入模块
import torchvision
import torchvision.transforms as transforms  # 图像预处理工具
import matplotlib.pyplot as plt  # 绘图库

rows, cols = 10, 10  # 定义绘制网格的行列数（10x10）

功能：导入必要的库，定义全局常量 rows 和 cols，用于后续的图像网格展示。

2. 主函数 `main()`

def main():
    """ 主函数 """
    # 加载数据集
    cifar10_train = torchvision.datasets.cifar.CIFAR10(
        root='../datasets/CIFAR10',  # 数据集存储路径
        train=True,                  # 加载训练集
        download=False,             # 如果数据集不存在，可设为True自动下载
        transform=transforms.ToTensor()  # 将PIL图像转换为张量（形状为 [C, H, W]，值范围0~1）
    )
    train_images, train_labels = cifar10_train.data, cifar10_train