第P2周：CIFAR10彩色图片识别

黄油飞起来了

已于 2024-08-18 22:51:32 修改

阅读量288

点赞数 4

文章标签： python

于 2024-08-17 11:53:42 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_46278303/article/details/141277639

版权

深度学习学习笔记02-CIFAR10彩色图片识别

我的环境

电脑系统：Windows 11
显卡：NVIDIA RTX4060
语言环境：Python 3.8.10
开发工具：Jupyter notebook
深度学习环境：Pytorch 1.9.0 + cu111

一、前期准备

设置GPU

若输出cuda则使用了GPU，否则使用的是CPU

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision

# 设置硬件设备，如果有GPU则使用，没有则使用cpu
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

device(type='cuda') 我的电脑使用的是gpu加速

代码输出

device(type=‘cuda’)

导入数据

从dataset下载MNIST数据集，划分训练集与测试集

函数原型：

torchvision.datasets.MNIST(root, train=True, transform=None, target_transform=None, download=False)

train_ds = torchvision.datasets.CIFAR10('data', 
                                      train=True, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

test_ds  = torchvision.datasets.CIFAR10('data', 
                                      train=False, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

torch.utils.data.DataLoader函数

torch.utils.data.DataLoader是Pytorch自带的一个数据加载器，结合了数据集和取样器，并且可以提供多个线程处理数据集。

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=None, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, *, prefetch_factor=2, persistent_workers=False, pin_memory_device=‘’)

batch_size = 32

train_dl = torch.utils.data.DataLoader(train_ds, 
                                       batch_size=batch_size, 
                                       shuffle=True)

test_dl  = torch.utils.data.DataLoader(test_ds, 
                                       batch_size=batch_size)

# 取一个批次查看数据格式
# 数据的shape为：[batch_size, channel, height, weight]
# 其中batch_size为自己设定，channel，height和weight分别是图片的通道数，高度和宽度。
imgs, labels = next(iter(train_dl))
imgs.shape

代码输出

torch.Size([32, 3, 32, 32])

数据可视化

import numpy as np

 # 指定图片大小，图像大小为20宽、5高的绘图(单位为英寸inch)
plt.figure(figsize=(20, 5)) 
for i, imgs in enumerate(imgs[:20]):
    # 维度缩减
    npimg = np

最低0.47元/天解锁文章