Pytorh学习——DataSet和DataLoader

最新推荐文章于 2025-05-17 16:48:30 发布

MatrixSpace001

最新推荐文章于 2025-05-17 16:48:30 发布

阅读量2k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： pytorch 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_37319825/article/details/119294534

目录

Pytorch的数据集

创建自定义数据集

Pytorch的数据集

Pytorch深度学习库以一种可读性强、模块化程度高的方式来构建深度学习网络。在构建深度学习网络时，数据的加载和预处理是一项重要而繁琐的工作。如果在构建网络中，我们需要为加载样本数据、样本数据预处理编写大量的处理代码，会导致代码变得混乱、网络构建过程不清晰，最终难以维护。

基于以上考虑，Pytorch将数据集和数据集的加载定义为两个单独对象，使数据集代码和模型训练代码相分离，以获得更好的可读性和模块化。

Pytorch提供了两个DataSet和DataLoader两个类。

DataSet

DataSet是数据集对象类， Pytorch提供了大量的默认数据集，包括Fashion-MINST、CIFAR-10、CIFAR-100、CelebA等数据集。如果用户想要加载自定义的数据只需要继承DataSet类。

Pytorch支持两种类型的DataSet:

Map类型DataSet
Iterable类型DataSet

Map类型DataSet

Map类型DataSet实现__getitem__()和 __len__()，表示从索引/键到数据样本的映射。数据集在使用访问时，可以通过索引直接获取相关样本数据。例如，dataset[idx]表示使用idx从磁盘上的文件夹中读取第i个图像及其相应的标签。

Iterable类型DataSet

IterableDataset 实现了__iter__()函数，可对数据样本进行迭代访问。这种类型的数据集特别适用于随机读取代价高昂以及批量大小取决于获取的数据等场景。

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄9年

5
原创

14
点赞

97
收藏

3
粉丝

关注

私信

热门文章

分类专栏

机器学习 5篇
Python

上一篇：: Python图片处理库Pillow

下一篇：: Pytorch实战——基于RNN的新闻分类

最新评论

Pytorch实战——基于RNN的新闻分类
2301_79899787: ConnectionError: HTTPSConnectionPool(host='raw.githubusercontent.com', port=443): Max retries exceeded with url: /mhjabreel/CharCnn_Keras/master/data/ag_news_csv/train.csv (Caused by NameResolutionError("<urllib3.connection.HTTPSConnection object at 0x0000025D083597F0>: Failed to resolve 'raw.githubusercontent.com' ([Errno 11004] getaddrinfo failed)"))一直报错欸，就是加载数据集的时候
Pytorch实战——基于RNN的新闻分类
不想秃头的斜眼窝瓜: Could not run 'aten::_foreach_norm.Scalar' with arguments from the 'SparseCPU' backend. This could be because the operator doesn't exist for this backend, or was omitted during the selective/custom build process (if using custom build). If you are a Facebook employee using PyTorch on mobile, please visit https://fburl.com/ptmfixes for possible resolutions. 'aten::_foreach_norm.Scalar' is only available for these backends: [CPU, BackendSelect, Python, FuncTorchDynamicLayerBackMode, Functionalize, Named, Conjugate, Negative, ZeroTensor, ADInplaceOrView, AutogradOther, AutogradCPU, AutogradCUDA, AutogradHIP, AutogradXLA, AutogradMPS, AutogradIPU, AutogradXPU, AutogradHPU, AutogradVE, AutogradLazy, AutogradMeta, AutogradMTIA, AutogradPrivateUse1, AutogradPrivateUse2, AutogradPrivateUse3, AutogradNestedTensor, Tracer, AutocastCPU, AutocastCUDA, FuncTorchBatched, FuncTorchVmapMode, Batched, VmapMode, FuncTorchGradWrapper, PythonTLSSnapshot, FuncTorchDynamicLayerFrontMode, PythonDispatcher].
Pytorch实战——基于RNN的新闻分类
m0_74747473: 报错，TypeError: 'ShardingFilterIterDataPipe' object is not an iterator

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。