[Pytorch]DataLoader数据读取机制

最新推荐文章于 2025-05-14 23:05:40 发布

原创

最新推荐文章于 2025-05-14 23:05:40 发布 · 892 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #人工智能 #python

作用：

在实际项目中，如果数据量很大，考虑到内存有限、I/O 速度等问题，在训练过程中不可能一次性的将所有数据全部加载到内存中，也不能只用一个进程去加载，所以就需要多进程、迭代加载，而 DataLoader 就是基于这些需要被设计出来的。DataLoader 是一个迭代器，最基本的使用方法就是传入一个 Dataset 对象，它会根据参数 batch_size 的值生成一个 batch 的数据，节省内存的同时，它还可以实现多进程、数据打乱等处理。

pytorch的数据读取机制DataLoader包括两个子模块：

Sampler模块，主要是生成索引index
DataSet模块，主要是根据索引读取数据

Dataset是用来解决数据从哪里读取以及如何读取的问题。pytorch给定的Dataset是一个抽象类，所有自定义的Dataset都要继承它，并且复写__getitem__()和__len__()类方法，__getitem__()的作用是接受一个索引，返回一个样本或者标签。下面通过实例构造一个数据集：

import torch
from torch.utils.data import Dataset

class MyDataset(Dataset):
    # 构造函数
    def __init__(self, data_tensor, target

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Osidal

关注关注

10
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【pytorch】DataLoader（数据迭代器）包含多种DataLoader的生成方法

学渣的博客

09-22

6万+

本博客讲解了pytorch框架下DataLoader的多种用法，每一种方法都展示了实例，虽然有一点复杂，但是小伙伴静下心看一定能看懂哦：)，在1.1.1节介绍的三种方法中，推荐（方法三实在是过于复杂不做推荐），另外，第三节中的处理示例使用了非DataLoader的方法进行数据集处理，也可以借鉴~

pytorch 数据的读取

qq_40107571的博客

09-01

1955

pytorch 数据装载器dataloader ,以及超分辨率dataset的常规定义

2 条评论您还未登录，请先登录后发表或查看评论

2 条评论

全栈小5 2024.01.24
优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文【[Pytorch]DataLoader数据读取机制，博主这篇文章，值得一看】

优快云-Ada助手 2024.01.24
恭喜您写了第11篇博客！标题中的Pytorch DataLoader数据读取机制是一个非常重要的主题，对于深入了解Pytorch的数据处理和加载方式有着很大帮助。您的博客内容非常有深度和实用性，对读者来说是一份宝贵的学习资料。接下来，我建议您可以考虑在未来的创作中，结合具体案例或者示例代码，进一步探讨如何优化数据加载和预处理的方法，也可以分享一些在实际项目中应用DataLoader时遇到的挑战和解决方案。这样的深入讨论将为读者提供更多实际操作的指导，也能够帮助更多刚入门的Pytorch学习者更好地理解和应用DataLoader。再次感谢您的分享，期待您未来更多精彩的博客！