pytorch图像处理：读取数据集Dataset和ImageFolder

最新推荐文章于 2025-02-18 10:55:01 发布

iotflh

最新推荐文章于 2025-02-18 10:55:01 发布

阅读量7.5k

点赞数 9

分类专栏：计算机视觉 Pytorch

本文链接：https://blog.youkuaiyun.com/iotflh/article/details/109339933

版权

1、重写Dataset类:

#源码
class Dataset(object):
"""An abstract class representing a Dataset.
All other datasets should subclass it. All subclasses should override
``__len__``, that provides the size of the dataset, and ``__getitem__``,
supporting integer indexing in range from 0 to len(self) exclusive.
"""
 
#这个函数就是根据索引，迭代的读取路径和标签。因此我们需要有一个路径和标签的 ‘容器’供我们读
def __getitem__(self, index):
	raise NotImplementedError
 
#返回数据的长度
def __len__(self):
	raise NotImplementedError
def __add__(self, other):
	return ConcatDataset([self, other])

想制作自己的图像数据集供DataLoader拿取，首先要重写Datasets类，主要用来完成从哪里读取数据和标签的功能。主要是__getitem()__(返回数据集和标签)和__len__（返回数据的长度）这两个方法。

完成Datasets类的这两个主要功能后，训练的时候可以把数据集传送给DataLoader就可以获取自己想要的batch数据。

例1：通过包含数据路径和标签的TXT文件读取

# coding: utf-8
from PIL import Image
from torch.utils.data import Dataset
 
#集成Dataset类
clas

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iotflh

关注关注

9
点赞
踩
55

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Pytorch实用教程】pytorch中标准化图像数据集的读取处理神器：datasets.ImageFolder

若北辰

08-16

`datasets.ImageFolder` 是 PyTorch 中用于处理图像数据的一个非常方便的类，尤其适合用于组织良好的图像分类任务。它可以从文件夹结构中加载图像数据，并自动分配标签。

python读取文件数据生成图像_pytorch ImageFolder和Dataloader加载自制图像数据集

weixin_39952031的博客

11-26

1723

0 总结首先对数据集进行文件夹组织处理以适应ImageFolder的要求，然后将ImageFolder的返回结果作为DataLoader的输入，完成训练集数据和测试集数据的迭代。1.数据集简介数据集是从网上下载的宝可梦图像数据集，下载后的数据集已按文件夹名称分为5类，每类大约有220~240张图像，格式有jpg, jpeg, png和gif，经过简单的处理，随机从各类中抽取20张组成测试集，训练集...

1 条评论您还未登录，请先登录后发表或查看评论

数据集的读取和处理

m0_50460160的博客

05-29

513

【代码】数据集的读取和处理。

pytorch通过ImageFolder函数读取数据集（详细实例）

wqy1837154675的博客

08-14

7800

pytorch通过ImageFolder函数读取数据集（详细实例） dataset = ImageFolder(“E:/pycharmproject/dataset_read/veg200_images/”, transform=data_transform) #主要有两个参数，一个是图像根目录（被映射成标签的子目录的上一级），一个是数据操作本文理论参考，以下博客的方法二：https://blog.csdn.net/qq_36852276/article/details/94588656 1 代码 #通过

Pytorch框架02（PyTorch 数据处理板块/Dataset和DataLoader数据加载/Transforms/TensorBoard）

最新发布

XYX_888的博客

02-18

460

Dataset类是 PyTorch 用于封装数据的基础类，通常通过继承：返回数据集的大小（即样本的数量）。：根据索引idx返回数据集中的某一项数据，通常返回(数据, 标签)。MyDatasetDataLoader是 PyTorch 中用于批量加载数据的工具，能够自动将Dataset中的数据分批，并支持多线程加载，极大提高了训练效率。DataLoaderbatch_size：每个批次加载多少数据。shuffle：是否在每个 epoch 结束时打乱数据集，通常用于训练数据。：用于加载数据的子进程数量。

深度之眼【Pytorch】-读取自己的数据 Dataset 和 ImageFolder

刘宏宇的博客

10-22

1万+

本文为深度之眼pytorch训练营二期学习笔记，详细课程内容移步：深度之眼https://ai.deepshare.net/index 目录重写Dataset类例子一：通过包含数据路径与标签的文件读取例子二：通过标签文件读取例子三：没有标签文件，代码中自己构造文件夹读取：ImageFolder 例子一：重写Dataset类 Pytorch文档里的源码...

torchvision.datasets.ImageFolder数据加载

weixin_30279315的博客

02-25

1821

ImageFolder 一个通用的数据加载器，数据集中的数据以以下方式组织 root/dog/xxx.png root/dog/xxy.png root/dog/xxz.png root/cat/123.png root/cat/nsdf3.png root/cat/asd932_.png 　　 datasets.ImageFolder(root="r...

torchvision.datasets.folder.ImageFolder函数

qq_37803694的博客

10-14

918

返回从所有文件夹中得到的图片的路径以及其类别，一个列表，列表中的每个元素都是一个（这里不是一个具体的函数去操作哦，而是imagefolder的成员变量。根据分的文件夹的名字来确定的类别，如['cat', 'dog']。') #这里是在dog和cat之上的dogcat_2文件夹。# cat文件夹的图片对应label 0，dog对应1。# 所有图片的路径和对应的label。给定路径后如何读取图片，默认读取为。应当按照指定的格式进行存储。按顺序为这些类别定义索引为。是一个通用的数据加载器，指定的路径下寻找图片。

详解PyTorch预定义数据集类datasets.ImageFolder使用方法

hellozhxy的博客

10-17

3419

上述代码中，我们使用了Pandas库读取CSV文件记录的文件路径和标签，并使用pil库将图像读取为RGB格式的PIL Image类型。下面的示例代码展示了如何在训练过程中使用ImageFolder数据集读取顺序打乱的CSV数据。是PyTorch中预定义的用于处理图像分类任务的数据集类，并且可以轻松地进行自定义。类构建了训练数据集，并传入预处理的参数transform。，这个类是用于构建数据集的基类，我们可以在这个类中实现自定义数据集。类按照给定的路径构建数据集，并进行预处理，同时使用。

使用pytorch进行图像的顺序读取方法

09-20

`ImageFolder`类是PyTorch提供的一种方便的数据集类，它可以自动处理目录结构并加载图像。然而，当设置`shuffle=True`时，`DataLoader`会随机打乱数据，这并不适合顺序读取。在测试一中，作者创建了两个`DataLoader`...

torchvision.datasets.ImageFolder

The Thinker

12-03

2万+

这篇博客讲解了如何自定义一个 Dataset类返回训练数据与标签，但是对于简单的图像分类任务，并不需要自己定义一个 Dataset类，可以直接调用 torchvision.datasets.ImageFolder 返回训练数据与标签。 1. 数据集组织方式既然是调用API，那么你的数据集必然得按照API的要求去组织， torchvision.datasets.ImageFolder 要求数据...

【深度学习|Pytorch】torchvision.datasets.ImageFolder详解

传统图像处理，深度学习，目标检测（分类，检测，分割），多目标追踪，部署等

04-03

2503

self,root: str,):图片存储的根目录，即存放不同类别图片文件夹的前一个路径。即对加载的这些图片进行的前处理的方式，这里可以传入一个实例化的torchvision.Compose()对象，里面包含了各种预处理的操作。对图片类别进行预处理，通常来说不会用到这一步，因此可以直接不传入参数，默认图像标签没有变换，如果需要进行标签的处理，同样可以传入一个实例化的torchvision.Compose()对象。表示图像数据加载的方式，通常采用默认的加载方式，

pytorch Dataset 的ImageFolder

pytorch图像处理：读取数据集Dataset和ImageFolder

1、重写Dataset类:

例1：通过包含 数据路径 和 标签 的TXT文件读取

例1：通过包含数据路径和标签的TXT文件读取