＜从零开始pytorch＞:04-torch卷积神经网络搭建(巨详细总结)

最新推荐文章于 2025-04-19 17:13:59 发布

原创

最新推荐文章于 2025-04-19 17:13:59 发布 · 1k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#卷积 #pytorch #神经网络

本文从零开始介绍如何使用PyTorch搭建卷积神经网络，包括读取数据、构建模型、定义准确率评估标准、训练网络，并详细解释了torch.size()、torch.view()和DataLoader在数据处理中的应用。

构建卷积神经网络

卷积神经网络中的输入层与传统的神经网络有些区别,需要重新设计,训练模块基本一致

1.读取数据

1.dataset --> DataLoader构建batch数据
    - 既然是构建batch数据,故需要batch_size参数

2.搭建模型

 - 1.是个类
 - 2.定义__init__()函数
     - 1.继承父类
     - 2.定义用到的层 self.XXX = XXX 格式
 - 3.forward(self,x)函数中调用__init__()函数中定义好的层
     - 这个x指的是输入的数据

3.用数据和定义好的模型进行训练

- 0.训练需要实例化定义好的模型
- 1.获取到加载好的数据
- 2.定义好的模型中传入数据,获得结果
- 3.用得到的结果和真实值比较,可以得到损失值和准确率
- 4.反向传播,优化器进行梯度更新

# 导包
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets,transforms
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

1.读取数据

分别构建训练集和测试集(验证集)
使用DataLoader来迭代获取数据

# 定义超参数
input_size = 28 # 图像大小:28 * 28
num_classes = 10 # 标签的种类
num_epochs = 3 # 迭代的次数
batch_size = 64 # 每个批次的大小,即每64章图片一块进行一次训练

# 加载训练集
train_dataset = datasets.MNIST(
                                root='./data',
                                train=True,
                                transform=transforms.ToTensor(),
                                download=True
                                )
# 记载测试集
test_dataset = datasets.MNIST(root='./data',
                             train=False,
                             transform=transforms.ToTensor())
# 构建batch数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                          batch_size=batch_size,
                                          shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                         batch_size=batch_size,
                                         )

2.搭建卷积神经网络模型

class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        
        self.conv1 = nn.Sequential(    # 输入大小 (1,28,28)
            nn.Conv2d(
                in_channels=1,         # 说明是灰度图
                out_channels=16,       # 要得到多少个特征图
                kernel_size=5,         # 卷积核的大小
                stride=1,              # 步长
                padding=2),            # 边缘填充的大小
            nn.ReLU()

最低0.47元/天解锁文章