LeNet5 pytorch实现

这篇博客介绍了如何基于LeNet5网络结构训练MNIST数据集。网络包括卷积层C1、S2、C3、S4及全连接层F5、F6和F7。代码实现分为LeNet5.py定义网络结构和train.py进行模型训练,并导出ONNX模型,可通过Neutron查看网络结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

LeNet5

LeNet5网络结构

网络采用LeNet5结构,数据集为MNIST。输入为32x32的单通道图像。网络共分为7层。

网络结构

C1层-卷积层

核大小:5x5
核数目:6
步长:1
输出特征图大小:6x28x28
激活函数采用sigmoid

S2层-池化层

采用平均池化
核大小:2x2
步长:2
输出特征图大小:6x14x14

C3层-卷积层

核大小:5x5
核数目:16
步长:1
输出特征图大小:16x10x10
激活函数采用sigmoid

S4层-池化层

采用平均池化
核大小:2x2
步长:2
输出特征图大小:16x5x5

F5-全连接层

输入:400维
输出:120维

F6-全连接层

输入:120维
输出:84维

F7-全连接层

输入:84维
输出:10维


代码部分

LeNet5.py定义了网络结构
train.py训练模型,生成onnx文件。可以通过Neutron查看网络结构。

代码见github

LeNet-5神经网络 C源代码,这个写的比较好,可以用gcc编译去跑,结合理论可以对深度学习有更深刻的了解 介绍 根据YANN LECUN的论文《Gradient-based Learning Applied To Document Recognition》设计的LeNet-5神经网络,C语言写成,不依赖任何第三方库。 MNIST手写字符集初代训练识别率97%,多代训练识别率98%。 DEMO main.c文件为MNIST数据集的识别DEMO,直接编译即可运行,训练集60000张,测试集10000张。 项目环境 该项目为VISUAL STUDIO 2015项目,用VISUAL STUDIO 2015 UPDATE1及以上直接打开即可编译。采用ANSI C编写,因此源码无须修改即可在其它平台上编译。 如果因缺少openmp无法编译,请将lenet.c中的#include和#pragma omp parallel for删除掉即可。 API #####批量训练 lenet: LeNet5的权值的指针,LeNet5神经网络的核心 inputs: 要训练的多个图片对应unsigned char二维数组的数组,指向的二维数组的batchSize倍大小内存空间指针。在MNIST测试DEMO中二维数组为28x28,每个二维数组数值分别为对应位置图像像素灰度值 resMat:结果向量矩阵 labels:要训练的多个图片分别对应的标签数组。大小为batchSize batchSize:批量训练输入图像(二维数组)的数量 void TrainBatch(LeNet5 *lenet, image *inputs, const char(*resMat)[OUTPUT],uint8 *labels, int batchSize); #####单个训练 lenet: LeNet5的权值的指针,LeNet5神经网络的核心 input: 要训练的图片对应二维数组 resMat:结果向量矩阵 label: 要训练的图片对应的标签 void Train(LeNet5 *lenet, image input, const char(*resMat)[OUTPUT],uint8 label); #####预测 lenet: LeNet5的权值的指针,LeNet5神经网络的核心 input: 输入的图像的数据 labels: 结果向量矩阵指针 count: 结果向量个数 return 返回值为预测的结果 int Predict(LeNet5 *lenet, image input, const char(*labels)[LAYER6], int count); #####初始化 lenet: LeNet5的权值的指针,LeNet5神经网络的核心
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值