手写MNIST数字识别(pytorch)

部署运行你感兴趣的模型镜像

可使用GPU进行训练
在这里插入图片描述CPU版参考视频
参考代码(CPU)
参考代码(GPU)

import torch
from torch.utils.data import DataLoader
from torchvision import transforms
from torchvision.datasets import MNIST
import matplotlib.pyplot as plt
from torch import nn

# 检查CUDA设备是否可用,然后选择设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

#神经网络主体
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        #含4个全连接层
        self.fc1=nn.Linear(28*28,64)#输入为28*28图像,第0层设有64个节点
        self.fc2=nn.Linear(64,64)#0层:64个节点、1层:64个节点
        self.fc3=nn.Linear(64,64)#1层:64个节点,2层:64个节点
        self.fc4=nn.Linear(64,10)#2层:64个节点,输出:10个值
    
    def forward(self,x):#参数x为图像输入
        #每层传播中,先进行全连接线性计算,再套上激活函数
        x=nn.functional.relu(self.fc1(x))
        x=nn.functional.relu(self.fc2(x))
        x=nn.functional.relu(self.fc3(x))
        x=nn.functional.log_softmax(self.fc4(x),dim=1)#沿行(某一样本在所有类别)归一化
        return x

def get_data_loader(is_train):
    #数据转化为tensor类型
    to_tensor=transforms.Compose([transforms.ToTensor()])
    
    # 下载MNIST数据集
    # “”表示下载目录,若没指明则表示当前目录
    # is_train表示用于导入训练集/测试集,它是一个布尔值,指定是加载训练集还是测试集。True 表示加载训练集(60,000 张图片)。False 表示加载测试集(10,000 张图片)。
    # transform 数据预处理方法,用于将数据转换成 PyTorch 张量。
    # download=True,如果数据集不存在,会自动下载。
    data_set=MNIST("",is_train,transform=to_tensor,download=True)
    
    # data_set表示使用的数据集
    # batch_size=15表示一个批次包含15张图片
    # shuffle=True
    return DataLoader(data_set,batch_size=15,shuffle=True)
    # return DataLoader(data_set,batch_size=128,shuffle=True)


# 评估神经网络识别正确率
def evaluate(test_data,net):
        #n_correct:用于记录模型预测正确的样本数量。
        #n_total:用于记录测试样本的总数量。
        n_correct=0
        n_total=0
        with torch.no_grad():#禁用梯度计算。在评估模型时,我们不需要计算梯度,因为不会进行反向传播。使用 torch.no_grad() 可以节省内存并提高计算效率。
            # 在测试集中按批次取出数据
            for (x,y) in test_data:
                # 计算神经网络的预测值
                x,y=x.to(device),y.to(device)
                outputs=net.forward(x.view(-1,28*28))
                # 对批次中的每个结果进行比较,累加正确数量。
                for i,output in enumerate(outputs):
                    # argmax:计算数列中数列最大值的序号
                    if torch.argmax(output)==y[i]:
                        n_correct+=1
                    n_total+=1

                # 使用批量操作计算准确率
                # predictions = torch.argmax(outputs, dim=1)
                # n_correct += (predictions == y).sum().item()
                # n_total += y.size(0)
        return n_correct/n_total

def main():
    train_data=get_data_loader(is_train=True)
    test_data=get_data_loader(is_train=False)
    net=Net()
    net.to(device)# 将模型移动到选择的设备

    print("initial accuracy:",evaluate(test_data,net))

    #训练神经网络,pytorch固定写法
    optimizer=torch.optim.Adam(net.parameters(),lr=0.001)
    for epoch in range(2):
        for (x,y) in train_data:
            x,y=x.to(device),y.to(device)
            net.zero_grad()#初始化
            output=net.forward(x.view(-1,28*28))#正向传播
            loss=nn.functional.nll_loss(output,y)#计算误差损失
            loss.backward()#反向误差传播
            optimizer.step()#优化网络参数
        print("epoch",epoch,"accuracy:",evaluate(test_data,net))
    
    # x: 当前批次的输入图像张量(形状通常为 [batch_size, channels, height, width])。
    # _: 当前批次的目标标签张量(因为标签在这里没用,所以用 _ 忽略它)
    for (n,(x,_)) in enumerate(test_data):
        if n>3:
            break
        x=x.to(device)
        # x[0]: 从当前批次中选择第一张图像,形状为 [1, 28, 28](假设输入是 MNIST 数据)。
        # .view(-1, 28*28): .view类似numpy中的reshape,这里将选中的图像展平成一个一维向量,形状变为 [1, 784],以匹配模型 net 的输入要求。
        # net.forward(x[0].view(-1, 28*28)): 将展平后的图像输入到模型中,得到预测结果。输出是一个形状为 [1, 10] 的张量,表示该图像在 10 个类别上的预测分数。
        # torch.argmax(...): 找到输出张量中分数最高的索引,这个索引代表模型预测的类别。
        # predict: 预测的类别索引(整数),即模型认为这张图片属于哪一类(如 0-9 的数字)。
        predict=torch.argmax(net.forward(x[0].view(-1,28*28)))
        
        # plt.figure(n): 创建一个新的 Matplotlib 图像窗口,用于绘制第 n 个图像。
        plt.figure(n)
        # x[0]: 当前批次的第一张图像,形状为 [1, 28, 28]。
        # .view(28, 28): 将张量调整为二维形状 [28, 28],以便 Matplotlib 显示为图像。
        # .cpu(): 如果 x[0] 在 GPU 上,需要将其移动到 CPU 上,才能使用 Matplotlib 处理。
        #.numpy(): 将 PyTorch 张量转换为 NumPy 数组,这是 Matplotlib 能够处理的格式。
        # cmap='gray': 指定颜色映射为灰度图,适用于 MNIST 图像数据。
        plt.imshow(x[0].view(28,28).cpu().numpy(),cmap='gray')
        # str(int(predict)): 将预测的类别索引转换为字符串形式,显示在标题中。
        plt.title("prediction: "+str(int(predict)))
    plt.show()


if __name__=="__main__":
    main()

运行结果运行结果

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值