基于LeNet-5的CIFAR10数据集分类（pytorch）

最新推荐文章于 2022-12-19 16:52:27 发布

原创

最新推荐文章于 2022-12-19 16:52:27 发布 · 1.5k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

CIFAR-10 数据集简介 CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图片：飞机（ a叩lane ）、汽车（ automobile ）、鸟类（ bird ）、猫（ cat ）、鹿（ deer ）、狗（ dog ）、蛙类（ frog ）、马（ horse ）、船（ ship ）和卡车（ truck ）。图片的尺寸为 32×32，RGB三通道，数据集中一共有 50000 张训练图片和 10000 张测试图片。 CIFAR-10 的图片样例如图所示。

LeNet-5是一种经典的卷积神经网络结构，于1998年投入实际使用中。该网络最早应用于手写体字符识别应用中。普遍认为，卷积神经网络的出现开始于LeCun 等提出的LeNet 网络（LeCun et al., 1998），可以说LeCun 等是CNN 的缔造者，而LeNet-5 则是LeCun 等创造的CNN 经典之作。所以我们选择采用简单改造过一点点的LeNet-5网络（添加了ReLu非线性激活函数和dropout防止过拟合）去训练CIFAR10数据集。下图是本次介绍的网络模型图。其中卷积核的大小是5x5，步长为1，padding为2。池化是2x2。最后输出的是10个预测值。

导入相关的库

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

准备数据集和加载数据

加载好之后我们再用Dataloader把图片进行批量处理（64张图片每一批）注意：如果CIFAR10数据集未下载，download为True会帮你下载

data_transform = torchvision.transforms.Compose([
                                     torchvision.transforms.RandomHorizontalFlip(),#随机翻转
                                     torchvision.transforms.ToTensor()
])##先将图片数据进行随机翻转再转化