PyTorch学习笔记(8)训练模型全过程

本文详细记录了使用PyTorch进行CIFAR10数据集的图像分类任务,包括数据预处理、构建简单的卷积神经网络模型、损失函数与优化器设置、训练过程及可视化展示。通过迭代训练,观察损失函数下降,最终进行模型测试并保存模型权重。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

终于到了训练的时候了,从今开始正式炼丹。
这里以 CIFAR10 数据集(常见的分类问题,共10个类别)为例,记录从准备数据集、搭建模型、训练模型的全过程,并做可视化展示。


准备数据集

train=True表示下载训练集,使用 transforms.ToTensor() 进行转化是因为计算机只能处理数字,图像也得转化为数字才能进行特征提取与后续复杂操作。
batch_size=64 可以理解为一次处理 64 张图片,如果 GPU 专用内存不足,需要调小。

import torchvision
from torch.utils.data import DataLoader

# 准备数据集
train_data = torchvision.datasets.CIFAR10("../dataset_CIFAR10",train=True,
                                          transform=torchvision.transforms.ToTensor(),download=True)
test_data  = torchvision.datasets.CIFAR10("../dataset_CIFAR10",train=False,
                                          transform=torchvision.transforms.ToTensor(),download=True)
# 打印数据长度
train_data_length = len(train_data)
test_data_length = len(test_data)
print("训练数据集的长度:{}".format(train_data_length))
print("测试数据集的长度:{}".format(test_data_length))

# 利用DataLoader来加载数据
train_dataloader = DataLoader(train_data,batch_size=64)
test_dataloader = DataLoader(test_data,batch_size=64)

准备网络模型

这里直接用之前复现的网络:PyTorch学习笔记(5)搭建简单神经网络

from torch import nn
from torch.nn import Sequential, Conv2d, MaxPool2d, Linear, Flatten

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.moudle = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x =  self.moudle(x)
        return x

# 搭建神经网络
tudui = Tudui()

定义损失函数与优化器

optim.SGD 表示使用随机梯度下降算法。

# 损失函数
loss_fn = nn.CrossEntropyLoss()

# 优化器
learning_rate = 0.01 #学习速率
optimizer = torch.optim.SGD(params=tudui.parameters(),lr=learning_rate)

迭代训练过程

for i in range(epoch):
    print("---第{}轮训练开始---".format(i+1))

    #训练步骤如下
    for data in train_dataloader:
        imgs,targets = data
        outputs = tudui(imgs)
        loss = loss_fn(outputs,targets)     #两个参数的顺序不能错

        # 优化器优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step += 1
        # 逢100打印一次
        if total_train_step % 100 == 0:
            print("训练次数为:{},loss为:{}".format(total_train_step,loss))

训练过程如下:

image-20220819205510781

再加上测试代码:

 # 测试步骤
    total_test_loss = 0
    total_accuracy = 0      #总共正确的个数
    #没有梯度,不进行优化,使用上一刻训练的模型
    with torch.no_grad():
        for data in test_dataloader:
            imgs,targets = data
            outputs = tudui(imgs)
            loss = loss_fn(outputs,targets)

            total_test_loss += loss
            total_test_step += 1
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy += accuracy
            pass
    print("本轮测试集上的Loss为:        {}".format(total_test_loss))
    print("本轮测试集上的正确率为:       {}".format(total_accuracy / test_data_length))
    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    writer.add_scalar("test_accuracy",total_accuracy/test_data_length,total_test_step)

完整代码

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torch.nn import Sequential, Conv2d, MaxPool2d, Linear, Flatten


# 准备数据集
train_data = torchvision.datasets.CIFAR10("../dataset_CIFAR10",train=True,
                                          transform=torchvision.transforms.ToTensor(),download=False)
test_data  = torchvision.datasets.CIFAR10("../dataset_CIFAR10",train=False,
                                          transform=torchvision.transforms.ToTensor(),download=False)
# 打印数据长度
train_data_length = len(train_data)
test_data_length = len(test_data)
print("训练数据集的长度:{}".format(train_data_length))
print("测试数据集的长度:{}".format(test_data_length))

# 利用DataLoader来加载数据
train_dataloader = DataLoader(train_data,batch_size=64)
test_dataloader = DataLoader(test_data,batch_size=64)

# 搭建神经网络
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.moudle = Sequential(
            Conv2d(3, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x =  self.moudle(x)
        return x
    
# 搭建神经网络
tudui = Tudui()

# 损失函数
loss_fn = nn.CrossEntropyLoss()

# 优化器
learning_rate = 0.01 #学习速率
optimizer = torch.optim.SGD(params=tudui.parameters(),lr=learning_rate)

# 记录训练网络的一些参数
# 训练和测试的次数
total_train_step = 0
total_test_step = 0
# 训练的轮数
epoch = 10
# 添加tensorboard
writer = SummaryWriter("../logs")

for i in range(epoch):
    print("---第{}轮训练开始---".format(i+1))

    #训练步骤如下
    for data in train_dataloader:
        imgs,targets = data
        outputs = tudui(imgs)
        loss = loss_fn(outputs,targets)     #两个参数的顺序不能错

        # 优化器优化模型
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step += 1
        # 逢100打印一次
        if total_train_step % 100 == 0:
            print("训练次数为:{},loss为:{}".format(total_train_step,loss))
            writer.add_scalar("train_loss",loss,total_train_step)   # y轴和x轴

    # 测试步骤
    total_test_loss = 0
    total_accuracy = 0      #总共正确的个数
    #没有梯度,不进行优化,使用上一刻训练的模型
    with torch.no_grad():
        for data in test_dataloader:
            imgs,targets = data
            outputs = tudui(imgs)
            loss = loss_fn(outputs,targets)

            total_test_loss += loss
            total_test_step += 1
            accuracy = (outputs.argmax(1) == targets).sum()
            total_accuracy += accuracy
            pass
    print("本轮测试集上的Loss为:        {}".format(total_test_loss))
    print("本轮测试集上的正确率为:       {}".format(total_accuracy / test_data_length))
    writer.add_scalar("test_loss",total_test_loss,total_test_step)
    writer.add_scalar("test_accuracy",total_accuracy/test_data_length,total_test_step)

    torch.save(tudui,"moudel_{}.pth".format(i+1))

writer.close()

查看结果

可以看到,损失 loss 在不断地下降。
image-20220819220027323
使用 tensorboard 查看可以更加清晰地观测训练过程(也方便做 PPT)。
image-20220819220039990

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值