【Pytorch基础】torch.utils.data.DataLoader方法的使用

最新推荐文章于 2025-08-19 14:58:33 发布

原创

最新推荐文章于 2025-08-19 14:58:33 发布 · 4.8w 阅读

82 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #pytorch #人工智能

本文详细介绍了PyTorch的DataLoader如何对数据进行分批处理，强调了输入数据必须可迭代，并展示了如何创建自定义数据集。DataLoader的主要优点在于能够快速迭代数据并提供批量训练。通过实例展示了如何设置batch_size、shuffle和num_workers等参数，以及当数据不足一个batch时的处理方式。此外，还提供了多个参考资源帮助读者深入理解DataLoader的使用。

torch.utils.data.DataLoader主要是对数据进行batch的划分，除此之外，特别要注意的是输入进函数的数据一定得是可迭代的。如果是自定的数据集的话可以在定义类中用def__len__、def__getitem__定义。
使用DataLoader的好处是，可以快速的迭代数据。

import torch
import torch.utils.data as Data
torch.manual_seed(1)    # reproducible
 
BATCH_SIZE = 5      # 批训练的数据个数
 
x = torch.linspace(1,

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一穷二白到年薪百万

关注关注

45
点赞
踩
82

收藏

觉得还不错? 一键收藏
9
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch源码解读之torch.utils.data.DataLoader

AI之路

01-14

22万+

PyTorch中数据读取的一个重要接口是torch.utils.data.DataLoader，该接口定义在dataloader.py脚本中，只要是用PyTorch来训练模型基本都会用到该接口，该接口主要用来将自定义的数据读取接口的输出或者PyTorch已有的数据读取接口的输入按照batch size封装成Tensor，后续只需要再包装成Variable即可作为模型的输入，因此该接口有点承上启下的

解决 batch_sampler option is mutually exclusive with batch_size, shuffle, sampler, and drop_last

qq_38343151的博客

06-22

9174

因为我再dataloader中传入了drop_last=True，就报错ValueError: batch_sampler option is mutually exclusive with batch_size, shuffle, sampler, and drop_last，看源码发现问题所在，因为参数设置的冲突导致，我设置batch_sampler这个参数，一旦指定了这个参数，那么batch_size,shuffle,sampler,drop_last就不能再制定了（互斥——Mutually exc.

9 条评论您还未登录，请先登录后发表或查看评论

9 条评论

夏钰彤 2023.08.09
请问多线程读取数据比单线程读取数据慢是什么原因

xz_404 2021.12.08
为什么我打印那里全报错
- m0_48723652回复xz_404 2023.07.26
  if __name__ == '__main__': show_batch() 把函数放到main里跑就行不然跑不了多线程
- 辛德瑞拉没有拉拉拉拉拉--回复一穷二白到年薪百万 2023.02.10
  那怎么修改呢[face]emoji:029.png[/face]
- 一穷二白到年薪百万回复辛德瑞拉没有拉拉拉拉拉-- 2023.02.10
  难道是版本问题？
- 辛德瑞拉没有拉拉拉拉拉--回复一穷二白到年薪百万 2023.02.10
  我的也是 import torch from torch.utils.data import DataLoader from torchvision import datasets from torchvision import transforms from torch.autograd import Variable import torch.optim as optim
- 一穷二白到年薪百万回复xz_404 2021.12.10
  贴一下报错信息