torch.utils.data.DataLoader主要是对数据进行batch的划分,除此之外,特别要注意的是输入进函数的数据一定得是可迭代的。如果是自定的数据集的话可以在定义类中用def__len__、def__getitem__定义。
使用DataLoader的好处是,可以快速的迭代数据。
import torch
import torch.utils.data as Data
torch.manual_seed(1) # reproducible
BATCH_SIZE = 5 # 批训练的数据个数
x = torch.linspace(1,

本文详细介绍了PyTorch的DataLoader如何对数据进行分批处理,强调了输入数据必须可迭代,并展示了如何创建自定义数据集。DataLoader的主要优点在于能够快速迭代数据并提供批量训练。通过实例展示了如何设置batch_size、shuffle和num_workers等参数,以及当数据不足一个batch时的处理方式。此外,还提供了多个参考资源帮助读者深入理解DataLoader的使用。
最低0.47元/天 解锁文章
22万+





