mmdetection中dataloader和dataset——决定如何读取数据并输入网络中

摸鱼的肚子

已于 2022-06-15 16:32:33 修改

阅读量1.2k

点赞数

分类专栏： mmdetection学习文章标签：深度学习 python 人工智能目标检测

于 2022-06-13 16:53:02 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_45216013/article/details/125236280

版权

mmdetection学习专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了MMDetection中的dataset和dataloader在数据加载过程中的作用，涉及dataset如何读取和预处理PASCAL VOC数据，以及dataloader如何组织和调度数据输入网络。重点讲解了CustomDataset和CustomData类，以及build_dataset和data_loader的创建过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

mmdetection中dataloader和dataset——决定如何读取数据并输入网络中

1、dataset和dataloader的区别

dataset是决定如何读入训练数据，如何通过训练图片的路径来找到并读取这种图片，读取图片后要进行什么操作，这都是dataset控制的，每个训练的数据集，都会写一个自己的dataset，如coco.py ，voc.py等，用来展示如何读数取这个数据集的数据。dataloader：主要是把dataset读到的图片，按照一定顺序排起来，就像一条管道，一次输入一个batchsize的数据进入网络。
dataset的输出是dataloader的输入。

2、dataset-voc.py

2.1 PASCALVOCDATASET类

继承了 CustomDataset类，CustomDataset类是每个数据集类都必须继承的，因为CustomDataset类里面包含了数据集类都一定要用到的操作，所以我们无论是初始化CocoDataset还是VocDataset等等，都一定会包含CustomData类中的所有方法。

2.2 getitem(idx) 的作用：

该函数控制dataset这个类怎么输出要训练的数据，dataset的输出其实就是__getitem__(idx) 的输出（类似nn.moudle类中forward函数）。
idx表示训练数据的索引，dataloader就按照这个自动生成的索引顺序来输出图片到网络中训练。getitem(idx)返回的图片数据输入到dataloader。
在__getitem__(idx)中就完成读入图片、读入标注、resize、归一化、padding等等

3、初始化dataset——build_dataset()

根据传入build_dataset()类中的数据集名字来初始化数据集对应，构建全局变量DATASETS。dataset主要由build_from_cfg（）产生，根据传入的cfg里的数据集信息从dataset里面找到对应的数据集类别，然后初始化。
（比如cfg里面有pascalvoc就初始化pascalvoc，在小样本目标检测里面，如果是meta训练的话，判断cfg里是base数据集还是novel数据集，再初始化对应的数据集类别等）