pytorch一步一步在VGG16上训练自己的数据集

最新推荐文章于 2025-02-05 11:18:09 发布

置顶

hnu_zzt

最新推荐文章于 2025-02-05 11:18:09 发布

阅读量3.3w

点赞数 31

分类专栏： CRNN图像序列预测文章标签： pytorch 数据集加载

本文链接：https://blog.youkuaiyun.com/hnu_zzt/article/details/85092092

版权

准备数据集及加载，ImageFolder

在很多机器学习或者深度学习的任务中，往往我们要提供自己的图片。也就是说我们的数据集不是预先处理好的，像mnist，cifar10等它已经给你处理好了，更多的是原始的图片。比如我们以猫狗分类为例。在data文件下，有两个分别为train和val的文件夹。然后train下是cat和dog两个文件夹，里面存的是自己的图片数据，val文件夹同train。这样我们的数据集就准备好了。
在这里插入图片描述
ImageFolder能够以目录名作为标签来对数据集做划分，下面是pytorch中文文档中关于ImageFolder的介绍：

#对训练集做一个变换
train_transforms = transforms.Compose([
    transforms.RandomResizedCrop(224),		#对图片尺寸做一个缩放切割
    transforms.RandomHorizontalFlip(),		#水平翻转
    transforms.ToTensor(),					#转化为张量
    transforms.Normalize((.5, .5, .5), (.5, .5, .5))	#进行归一化
])
#对测试集做变换
val_transforms = transforms.Compose([
    transforms.Resize(256),
    transforms.RandomResizedCrop(224),
    transforms.ToTensor(),
    transforms.Normalize((.5, .5, .5), (.5, .5, .5))
])

train_dir = "G:/data/train"           #训练集路径
#定义数据集
train_datasets = datasets.ImageFolder(train_dir, transform=train_transforms)
#加载数据集
train_dataloader = torch.utils.data.DataLoader(train_datasets, batch_size=batch_size, shuffle=True)

val_dir = "G:/da

最低0.47元/天解锁文章