深度学习笔记——pytorch解决多分类问题 Multi-Class Classification

本文介绍了使用PyTorch实现多分类问题的深度学习教程,包括多层模型结构、交叉熵损失函数的应用以及如何使用MNIST数据集进行训练。代码示例展示了构建网络、定义损失函数、优化器以及训练和测试过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

系列文章目录

机器学习笔记——梯度下降、反向传播
机器学习笔记——用pytorch实现线性回归
机器学习笔记——pytorch实现逻辑斯蒂回归Logistic regression
机器学习笔记——多层线性(回归)模型 Multilevel (Linear Regression) Model
深度学习笔记——pytorch构造数据集 Dataset and Dataloader
深度学习笔记——pytorch解决多分类问题 Multi-Class Classification
深度学习笔记——pytorch实现卷积神经网络CNN
深度学习笔记——卷积神经网络CNN进阶
深度学习笔记——循环神经网络 RNN
深度学习笔记——pytorch实现GRU



前言

参考视频:B站刘二大人《pytorch深度学习实践》


一、多分类问题 Multi-Class Classification

1.多分类模型结构

在这里插入图片描述
模型结构图,以mnist数据集为例,通过多层的计算,最后输出10个值。即该数为1的概率、为2的概率、为3的概率…
在这里插入图片描述

所以最后的输出应该是一个分布,满足yi>0且y1+y2+y3+…+y10=1,即所有可能都大于零且所有可能之和等于1.
在这里插入图片描述
将最后一层的激活函数换成softmax分类器,softmax能够输出一个分布。
在这里插入图片描述
softmax计算公式
在这里插入图片描述

例子:假设输出0.2、0.1、-0.1三个数,将三个数进行e的指数运算,得到1.22、1.11、0.90,三个数之和为3.23,最后的分布为0.38、0.34、0.28.所以0.2的概率最大。

2.交叉熵损失函数

在这里插入图片描述

3.数据集

在这里插入图片描述
mnist数据集是手写数字识别,共有十个分类,即0、1、2、3、4、5、6、7、8、9。
在这里插入图片描述
输入的图像是长和宽都为28个像素的图像,用矩阵表示如图。
在这里插入图片描述
在python的PIL中,图像的像素值在0-255之间,我们要把其转换为一个张量,像素值在0-1之间
在这里插入图片描述
在通常的图像处理包下,图像是宽✖高✖通道,而pytorch为了更好的计算,需要转换为通道✖宽✖高的形式。

二、代码

1.代码

#!/user/bin/env python3
# -*- coding: utf-8 -*-
import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.optim as optim

# 数据集
batch_size = 64
transform = transforms.Compose([
    transforms.ToTensor(),      # 图像转为张量
    transforms.Normalize((0.1307,), (0.3081,))  # 根据均值和标准差,进行归一化处理
])
# 训练集
train_dataset = datasets.MNIST(root=r'learn_torch/mnist/',
                               train=True,
                               download=True,
                               transform=transform)
train_loader = DataLoader(train_dataset, shuffle=True, batch_size=batch_size)
# 测试集
test_dataset = datasets.MNIST(root=r'learn_torch/mnist/',
                              train=False,
                              download=True,
                              transform=transform)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)


# 模型
class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.linear1 = torch.nn.Linear(784, 512)
        self.linear2 = torch.nn.Linear(512, 256)
        self.linear3 = torch.nn.Linear(256, 128)
        self.linear4 = torch.nn.Linear(128, 64)
        self.linear5 = torch.nn.Linear(64, 10)
        self.activate = torch.nn.ReLU()

    def forward(self, x):
        x = x.view(-1, 784)  # 改变张量的形状,将(64,1,28,28)的数据变成(64,784)的数据,-1其实就是自动获取mini_batch,
        x = self.activate(self.linear1(x))
        x = self.activate(self.linear2(x))
        x = self.activate(self.linear3(x))
        x = self.activate(self.linear4(x))
        return self.linear5(x)


# 模型实例化
model = Net()
# 损失函数
criterion = torch.nn.CrossEntropyLoss()  # 交叉熵损失
# 优化器
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)


# 训练
def train(epoch):
    running_loss = 0.0
    for batch_idx, data in enumerate(train_loader, 0):
        inputs, targets = data
        # forward
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        # backward
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        # 输出
        running_loss += loss.item()
        if batch_idx % 300 == 299:
            print('[%d,%5d] loss:%.3f' % (epoch + 1, batch_idx + 1, running_loss / 300))
            running_loss = 0.0


# 测试
def model_test():
    correct = 0  # 正确数据
    total = 0  # 全部数据
    with torch.no_grad():  # 不需要计算梯度
        for data in test_loader:
            images, labels = data
            outputs = model(images)
            _, predicted = torch.max(outputs.data, dim=1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
        print('Accuracy on test set:%d %%' % (100 * correct / total))


if __name__ == '__main__':
    for epoch in range(10):
        train(epoch)
        model_test()

2.运行结果

开始训练:在这里插入图片描述
十轮训练之后:
在这里插入图片描述


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值