Pytorch之Dataset和Dataloader(加载数据)

本文介绍了如何在PyTorch中使用Dataset和Dataloader处理数据,包括针对不同结构的数据(如文件夹分类和image-label分离)创建自定义Dataset,以及使用torchvision库中的CIFAR10数据集和预处理。此外,还详细讲解了如何使用Dataloader进行数据加载和展示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#Pytorch学习


前言。。

首先深度学习需要数据集,而数据集的处理离不开Dataset类和DataLoader类。
简单的区别一下Dataset和Dataloader:
Dataset是一个需要我们实现的抽象类,通过我们相关实现,表示数据集,实现数据集的具体功能。
而Dataloader,我们一般直接调用,调用来加载数据集。

先说一下常见的数据组成形式:

  1. 一个文件夹对应一个类,data根据类被分成不同的文件夹
  2. 一个图片文件对应名称为标签,
  3. 两个文件夹,一个文件夹存图片,另一个存标签。有的标签过于复杂,适合单独存放,而不放入名字里

一、Dataset

1.Dataset 是torch.utils.data.dataset包里一个抽象类,可以用来创建数据集,我们需要重写子类来完成数据集的创建。
2.其中最重要的两个方法就是len和getitem,也是子类必须要重写的方法,len函数返回数据集长度,getitem用来查找数据和标签

1.针对不同的文件夹存放不同的类数据

在这里插入图片描述
在这里插入图片描述
这里图片的名字并没有很大的意义。在这里插入图片描述

代码实现:

from torch.utils.data import Dataset
from PIL import Image   #这里用来读取图片数据
import os

class MyData(Dataset):  # 这里定义了一个MyData类继承Dataset读取数据

    def __init__(self, root_dir, label_dir):        #进行初始化数据
        self.root_dir = root_dir        #比如 "data/train"  相对路径
        self.label_dir = label_dir      #这里可以是 "ant"
        self.path = os.path.join(self.root_dir
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值