手写数字识别案例分析（torch，深度学习入门）

最新推荐文章于 2025-04-28 15:50:22 发布

富士达幸运星

最新推荐文章于 2025-04-28 15:50:22 发布

阅读量1.2k

点赞数 22

文章标签：深度学习机器学习人工智能

本文链接：https://blog.youkuaiyun.com/2401_84670644/article/details/142469008

版权

在人工智能和机器学习的广阔领域中，手写数字识别是一个经典的入门级问题，它不仅能够帮助我们理解深度学习的基本原理，还能作为实践编程和模型训练的良好起点。本文将带您踏上手写数字识别的深度学习之旅，从数据集介绍、模型构建到训练与评估，一步步深入探索。

一、引言

手写数字识别（Handwritten Digit Recognition）是指通过计算机程序自动识别手写数字的过程。最著名的手写数字数据集之一是MNIST（Modified National Institute of Standards and Technology database），它包含了大量的手写数字图片，每张图片都被标记了对应的数字（0-9）。这个数据集成为了初学者学习深度学习，尤其是卷积神经网络（CNN）的首选。

二、MNIST数据集简介

MNIST数据集由60,000个训练样本和10,000个测试样本组成，每个样本都是一张28x28像素的灰度图像，代表了一个手写数字。这些图像已经被归一化并居中在图像中心，使得数字不会受到位置变化的影响。

PyTorch 和 torchvision 库来下载并准备 MNIST 数据集，包括训练集和测试集

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

'''下载训练数据集（图片+标签）'''
training_data = datasets.MNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor()
)
test_data = datasets.MNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

打印设备信息：您的代码已经很好地检查了CUDA和MPS（针对Apple M系列芯片）的可用性，并设置了相应的设备。但是，在打印设备信息时，有一个小错误在字符串格式化上。您需要确保在字符串中正确地包含变量名。
打印数据形状：您已经正确地设置了DataLoader并打印了测试数据集中的一个批次的数据和标签的

最低0.47元/天解锁文章