PyTorch 1.0 中文文档：torchvision.datasets

最新推荐文章于 2025-10-10 18:28:14 发布

翻译最新推荐文章于 2025-10-10 18:28:14 发布 · 3.9w 阅读

ApacheCN 专栏收录该内容

228 篇文章

订阅专栏

本文详细介绍了PyTorch中数据集的使用，包括如何通过继承torch.utils.data.Dataset来创建自己的数据集，以及如何利用DataLoader进行数据的批处理和并行加载。文中列举了多种内置数据集，并解释了transform和target_transform参数的作用。

部署运行你感兴趣的模型镜像

译者：BXuan694

所有的数据集都是torch.utils.data.Dataset的子类，即：它们实现了__getitem__和__len__方法。因此，它们都可以传递给torch.utils.data.DataLoader，进而通过torch.multiprocessing实现批数据的并行化加载。例如：

imagenet_data = torchvision.datasets.ImageFolder('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True,
                                          num_workers=args.nThreads)