pytorch-Dataloader多进程使用出错

最新推荐文章于 2025-11-19 16:07:22 发布

原创最新推荐文章于 2025-11-19 16:07:22 发布 · 1.3k 阅读

2 ·

CC 4.0 BY-SA版权

报错专栏收录该内容

1 篇文章

订阅专栏

本文介绍使用Dataloader进行多进程数据导入时遇到的问题及解决方案。当num_works参数值不为0时，可能会出现错误。文章提供了一个简单的方法：在数据调用前加入if __name__ == '__main__':，即可解决此问题。

使用Dataloader进行多进程数据导入训练时，会因为多进程的问题而出错
在这里插入图片描述
其中参数num_works=表示载入数据时使用的进程数，此时如果参数的值不为0而使用多进程时会出现报错

此时在数据的调用之前加上if name == ‘main’:即可解决问题
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

苏小贤

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pytorch多进程加载数据

jacke121的专栏

11-24

3263

数据是提前准备，所以是在每次训练时，加载下一批的数据每个epoch最后一次，加载下一个epoch的数据。 def DataLoaderProcess(list_path,cfg, args, data_dict, file_names): rgb_mean = (104, 117, 123) # bgr order batch_size = cfg['batch_s...

Pytorch深度学习-----DataLoader的用法

LGL

07-27

1874

组合了数据集（dataset） + 采样器(sampler)，如果把Dataset比作一副扑克牌，则DataLoader就是每次手中处理的某一批扑克牌，然后每一批取多少张，总共能取多少批，用不用打乱顺序等，都可以在创建DataLoader时从参数自行设定。dataloader会将上面的img0……img3进行打包成imgs。- 如果为True会将数据放置到GPU上去（默认为false）在上述中共有15个参数，我们常用的有如下5个参数。– 表示每次从数据集中取多少个数据。– 表示要读取的数据集。

参与评论您还未登录，请先登录后发表或查看评论

windows下pytorch的dataloader多进程问题

qq_43749617的博客

12-06

1402

解决方法 numworkers=0 hhhh

DataLoader多进程数据加载

最新发布

糖葫芦君的博客

11-19

469

None:yield dataprint(f"跳过无法解析的 JSON 行: {line}")raise RuntimeError(f"文件 {self.file_dir} 未找到！")raise RuntimeError(f"读取文件时发生错误: {e}")你的代码对worker_id多进程场景（存在）：直接取（DataLoader 分配的子进程编号）。单进程场景（为None）：强制设。

Pytorch遍历DataLoader时报错【BrokenPipeError:[Errno 32]Broken pipe】

05-14

1670

问题描述 GPU环境训练好模型，CPU环境部署过程成功后，尝试遍历DataLoader的时候出现了以下报错信息。具体如下： Traceback (most recent call last): File "/usr/local/lib/python3.6/multiprocessing/resource_sharer.py", line 142, in _serve with self._listener.accept() as conn: File "/usr/local/lib/py

pytorch 中的数据集与多进程并发

yichudu

06-20

2342

需要 Dataset + collate_fn + Sampler + DataLoader 联用, 才等价于 tf 的 dataset.

跑论文代码时因为Pytorch多进程而产生的报错，复现环境：wins10

博客简介不能为空

03-04

510

后来发现是因为pytorch中使用data loader的时候，源代码中设置了num_workers为4，但是好像在 Windows 操作系统上，由于多进程的实现方式不同，可能这样会导致在使用 DataLoader 时出现问题。在打算复现论文代码的时候发现一直报错，如上所示；

大模型系列3--pytorch dataloader的原理

字节跳动内推找我

07-14

1691

pytorch dataloader代码分析

Pytorch的Dataloader使用详解

qq_53300975的博客

05-14

2264

definit2.使用Sampler进行不均衡数据采样。

PyTorch概述（四）---DataLoader

newsymme的博客

02-24

2513

windows或者MacOS上，spawn()是默认的multiprocessing启动方法；UNix上，fork() 是默认的multiprocessing启动方法；

PyTorch DataLoader 学习

刘念卿的博客

07-10

4984

首先定义一个数据集类，该类需要继承自并实现__len__和方法。# 创建一些示例数据data = torch.randn(100, 3, 64, 64) # 100个样本，每个样本为3x64x64的图像labels = torch.randint(0, 2, (100,)) # 100个标签，0或1如果需要自定义如何将样本合并为批次，可以定义自己的collate_fn函数。collate_fn处理变长序列：在处理变长序列或不规则数据时，自定义collate_fn函数，确保每个批次的数据能够正确合并。

【Dataloader】多进程加载数据导致CPU内存“泄漏”

agent_snail的博客

07-28

484

摘要：PyTorch DataLoader内存泄漏问题分析及解决方案。当使用自定义Dataset类时，__getitem__返回Python列表会导致内存持续增加，改用Numpy数组可避免此问题。对于大型.arrow格式数据集，实验表明设置num_workers=0比多进程加载更快且内存更稳定。两种情况的优化方案：1）继承Dataset类时输出数据转为Numpy数组；2）加载.arrow文件时禁用多进程可提升性能。（149字）

DataLoader

深浅卡布星的博客

08-23

278

Pytorch学习笔记

Pytorch中DataLoader相关操作

kking_edc的博客

09-27

231

在实践中，数据读取经常是训练的性能瓶颈，特别当模型简单或者计算硬件性能较高时。Pytorch的DataLoader中一个很方便的功能是允许使用多进程来加速数据读取。具体使用时设定其中的num_workers参数来指定读取数据的进程数。 ...

PyTorch Dataloader读取时，如何在进程之间传输数据？

idol24的博客

10-08

1598

点击上方“机器学习与生成对抗网络”，关注星标获取有趣、好玩的前沿干货！来源｜知乎作者｜Envy链接｜https://zhuanlan.zhihu.com/p/409629586编辑｜人...

Pytorch学习笔记（2）：数据读取机制（DataLoader与Dataset）

路人贾的博客

02-02

2847

Pytorch学习笔记（2）：数据读取机制（DataLoader与Dataset）

解决pytorch中Dataloader读取数据太慢的问题

热门推荐

Twilightzsj的博客

04-03

2万+

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、造成的原因二、查找不匹配的原因三、解决方法四、使用方法后言前言最近在使用pytorch框架进行模型训练时遇到一个性能问题，即数据读取的速度远远大于GPU训练的速度，导致整个训练流程中有大部分时间都在等待数据发送到GPU，在资源管理器中呈现出CUDA使用率周期性波动，且大部分时间都是在等待数据加载。一、造成的原因其实从前言中就可以知道，造成这样的原因可以理解为：GPU的算力与数据加载速度之间的不匹配。二、查找不.

Pytorch框架学习记录5——DataLoader的使用

NZR的blog

07-29

765

Pytorch框架学习记录5——DataLoader的使用

pytorch集锦(6)-处理数据DataLoader和Dataset(3)

The research on computer technolog

01-05

807

它可以在数据集的__iter_（）方法或DataLoader的worker_init_fn选项中使用，以修改每个副本的行为。例如，直接加载批处理数据（例如，从数据库批量读取或读取连续的内存块）可能更便宜，或者批处理大小取决于数据，或者程序设计用于处理单个样本。可迭代样式数据集是IterableDataset子类的一个实例，它实现__iter_（）协议，并表示可迭代的数据样本。映射样式数据集是实现__getitem__（）和__len__（）协议的数据集，它表示从（可能是非整数）索引/键到数据样本的映射。

windows 系统 pytorch dataloader 多进程加载

08-01

在 Windows 系统上使用 PyTorch 的 `DataLoader` 进行多进程数据加载时，需要特别注意一些与操作系统相关的限制和配置细节。 ### 多进程数据加载配置 `DataLoader` 提供了 `num_workers` 参数用于控制数据加载的子进程数量。在 Windows 上，多进程数据加载依赖于 Python 的 `multiprocessing` 模块，而 Windows 使用 `spawn` 方法来创建新进程，这意味着每个子进程都会重新导入主模块。因此，在使用 `num_workers > 0` 时，必须确保数据集和自定义的 `collate_fn`、`worker_init_fn` 等函数定义在 `if __name__ == '__main__':` 之外，以避免无限递归启动进程的问题。示例代码如下： ```python from torch.utils.data import DataLoader, Dataset import torch class ExampleDataset(Dataset): def __init__(self): self.data = torch.randn(100, 3, 224, 224) def __len__(self): return len(self.data) def __getitem__(self, idx): return self.data[idx] def worker_init_fn(worker_id): torch.manual_seed(worker_id) dataset = ExampleDataset() dataloader = DataLoader( dataset, batch_size=4, shuffle=True, num_workers=4, pin_memory=True, worker_init_fn=worker_init_fn ) for batch in dataloader: pass ``` 在 Windows 上运行上述代码时，需要将整个定义封装在 `if __name__ == '__main__':` 块中，以防止多进程运行时出现错误。例如： ```python if __name__ == '__main__': dataset = ExampleDataset() dataloader = DataLoader( dataset, batch_size=4, shuffle=True, num_workers=4, pin_memory=True, worker_init_fn=worker_init_fn ) for batch in dataloader: pass ``` ### 内存固定（Pin Memory）启用 `pin_memory=True` 可以加速从 CPU 到 GPU 的数据传输，因为 pinned memory（固定内存）允许更快的内存拷贝操作。在 Windows 上，此功能通常可用，但需确保系统有足够可用的内存资源[^1]。 ### 自定义 `collate_fn` 如果数据集返回的样本结构复杂，例如包含图像和不定长标签，通常需要自定义 `collate_fn` 来处理批次合并逻辑。以下是一个示例： ```python def collate_fn(batch): return torch.stack(batch) dataloader = DataLoader(dataset, batch_size=4, collate_fn=collate_fn, num_workers=4) ``` 在 Windows 上，自定义 `collate_fn` 必须是可序列化的，以便在多个进程中传递[^2]。 ### 分布式训练中的 `DataLoader` 在使用 `DistributedDataParallel`（DDP）进行分布式训练时，通常每个进程应使用一个独立的 `DataLoader` 实例，并结合 `DistributedSampler` 来确保每个进程加载不同的数据子集。这种配置可以最大化数据并行效率，并避免进程间数据重复。 ```python from torch.utils.data.distributed import DistributedSampler sampler = DistributedSampler(dataset) dataloader = DataLoader(dataset, batch_size=4, sampler=sampler, num_workers=4) ``` 在 Windows 上使用 DDP 时，还需确保所有进程能够正确通信，通常通过设置 `dist.init_process_group` 来初始化进程组[^3]。 ---