基于CNN的FashionMNIST数据集识别1——模型搭建与数据准备

模型搭建

我们这次使用LeNet模型,LeNet是一个经典的卷积神经网络(Convolutional Neural Network, CNN)架构,最初由Yann LeCun等人在1998年提出,用于手写数字识别任务

创建一个文件model.py。实现以下代码。

源码

# 导入PyTorch库
import torch
# 从PyTorch库中导入神经网络模块
from torch import nn
# 从torchsummary库中导入summary函数,用于打印模型的结构和参数数量
from torchsummary import summary

# 定义LeNet类,它继承自nn.Module,是一个神经网络模型
class LeNet(nn.Module):
    # 初始化函数,定义模型的层次结构
    def __init__(self):
        # 调用父类的初始化函数
        super().__init__()
        # 第一个卷积层,输入通道为1,输出通道为6,卷积核大小为5x5,padding为2
        self.c1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2)
        # Sigmoid激活函数
        self.sig = nn.Sigmoid()
        # 第一个平均池化层,池化窗口为2x2,步长为2
        self.s2 = nn.AvgPool2d(kernel_size=2, stride=2)
        # 第二个卷积层,输入通道为6,输出通道为16,卷积核大小为5x5
        self.c3 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5)
        # 第二个平均池化层,池化窗口为2x2,步长为2
        self.s4 = nn.AvgPool2d(kernel_size=2, stride=2)
        # Flatten层,用于将多维的输入一维化,以便输入到全连接层
        self.flatten = nn.Flatten()
        # 第一个全连接层,输入特征数为400,输出特征数为120
        self.f5 = nn.Linear(400, 120)
        # 第二个全连接层,输入特征数为120,输出特征数为84
        self.f6 = nn.Linear(120, 84)
        # 第三个全连接层,输入特征数为84,输出特征数为10(通常对应分类任务中的类别数)
        self.f7 = nn.Linear(84, 10)

    # 前向传播函数,定义数据通过网络的方式
    def forward(self, x):
        x = self.sig(self.c1(x))  # 通过第一个卷积层和Si
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值