RuntimeError: DataLoader worker (pid(s) ~) 的原因及解决方法

原创已于 2024-02-26 15:50:39 修改 · 1.5k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#python #深度学习

于 2024-02-26 15:50:06 首次发布

本文讨论了在使用PyTorchDataLoader时遇到的RuntimeError，特别指出是由于内存不足导致DataLoaderworker意外退出。作者建议通过调整workers数量和batch_size之间的关系来优化内存使用。

部署运行你感兴趣的模型镜像

RuntimeError: DataLoader worker (pid(s) 118983) exited unexpectedly

原因

由于内存不足

方法

在workers和batch_size参数之间做平衡

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Twosad

关注关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

精选资源

RuntimeError: DataLoader worker (pid(s) 9528, 8320) exited unexpectedly

01-06

RuntimeError: DataLoader worker (pid(s) 9528, 8320) exited unexpectedly 去网上搜教程，说是在loader定义的时候多进程的参数指定的问题，我的loader定义如下 loader = Data.DataLoader( dataset=torch_dataset,...

RuntimeError: DataLoader worker (pid(s) ***********) exited unexpectedly

teletubbies的博客

10-03

1515

File "D:\Pycharm-WorkSpace\d2l-zh-pytorch\5 卷积神经网络\5.6 深度卷积神经网络（AlexNet）.py", line 74, in File "D:\Pycharm-WorkSpace\d2l-zh-pytorch\5 卷积神经网络\5.6 深度卷积神经网络（AlexNet）.py", line 74, in # 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数。使用丢弃层来缓解过拟合。

参与评论您还未登录，请先登录后发表或查看评论

RuntimeError: DataLoader worker (pid 29911) is killed by signal: Terminated.

技术宅学长的博客

01-08

1594

t这个错误通常是由于在使用 PyTorch 的 DataLoader 时，数据加载的工作进程（worker）被系统终止而引起的。请注意，上述方法中的每一步都可能是解决问题的一部分，具体取决于你的系统和数据集的特定情况。：查看系统日志以获取更多关于进程终止的信息，这可能有助于确定问题的根本原因。：如果可能的话，增加系统内存，这可以通过更换更强大的硬件或者在云平台上使用更大的实例来实现。参数，即减少并行加载的工作进程数量。：确保你使用的是最新版本的 PyTorch，因为某些问题可能已经在后续版本中修复。

RuntimeError: DataLoader worker (pid(s) 17016, 18312) exited unexpectedly

weixin_44575717的博客

02-18

3809

RuntimeError: DataLoader worker (pid(s) 17016, 18312) exited unexpectedly

RuntimeError: DataLoader worker (pid(s) 46220) exited unexpectedly

weixin_42455006的博客

11-02

2924

其实吧，这个问题说难不难，说简单也简单。出现这个Error很明显，就是，而且不是以往那种CPU利用率拉满，而GPU虽然占用率拉满，但实际利用率不高的情况。打个比方，以前是cpu加载数据要个20-30s，但gpu零点几秒就处理完成了，从而一直等待。这种情况只会让模型运行时间变长而已。现在则是两极反转，Dataloader的了。导致cpu加载数据快到飞起，反而GPU跟不上了，就会出现异常，然后杀死进程，出现如上结果。

RuntimeError: DataLoader worker (pid(s) 6432, 27660) exited unexpectedly

qiao19121921的博客

03-19

693

在使用torch.utils.data.DataLoader时调用了多线程num_workers，需要将代码放置于 if __name__ == '__main__': 函数内执行。

RuntimeError: DataLoader worker (pid(s) 8548, 6916) exited unexpectedly

VegetableofDog的博客

05-12

9559

深度学习，Lenet函数的实现，神经网络，

【Bug】Pytorch RuntimeError: DataLoader worker (pid(s) 15904) exited unexpectedly

集电极

08-05

1639

这是由于多线程加载数据使用不当使用的错误，因此可以设置为单线程即可，num_workers 不设置或设置为。意思是，这是运行时错误，是由于在主进程完成初始化之前试图启动了新的进程导致的错误。将涉及dataloader 的代码放置在。在使用 PyTorch 的。下运行，修改代码如下。

报错：RuntimeError: DataLoader worker (pid(s) 10188) exited unexpectedly

qq_49785839的博客

03-21

2185

Pytorch 报错：RuntimeError: DataLoader worker (pid(s) 2420, 11236, 7252, 3104) exited unexpectedly 并没有显示出是哪一行代码出错，但是根据提示中的DataLoader worker可知是多线程的问题，对应到代码中应该就是下图这里： num_workers = 4 train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_siz

RuntimeError: DataLoader worker (pid XXX) is killed by signal: Bus error

weixin_44736853的博客

12-18

1042

【代码】RuntimeError: DataLoader worker (pid XXX) is killed by signal: Bus error。

RuntimeError: DataLoader worker (pid 186829) is killed by signal

m0_53936504的博客

02-21

474

DataLoader的worker由于共享内存不足而被系统终止。PyTorch的DataLoader使用了多进程（）来加速数据加载，而每个工作进程都需要一定的共享内存。如果系统的共享内存不足，就会触发。1、临时增加系统共享内存。

报错-RuntimeError: DataLoader worker (pid(s) 8032, 6100, 3156, 4912) exited unexpectedly

u010442263的博客

08-20

665

报错-RuntimeError: DataLoader worker (pid(s) 8032, 6100, 3156, 4912) exited unexpectedly

报错 RuntimeError: DataLoader worker (pid(s) 1240, 4312, 2124, 4716) exited unexpectedly

m0_50246514的博客

10-21

994

问题出现的原因可能是线程出现死锁，导致出现报错，一般的修改办法是把dataload中的num_workers设置为0，可以参考上述链接。找不到的友友可以查找 get_dataloader_workers ，记得去 troch.py 文件的 def 函数中。修改内容为：（只需要替这个函数的return部分）具体的位置如下：（我的文件中）

pytorch报错RuntimeError: DataLoader worker (pid(s) xxx) exited unexpectedly

最新发布

08-13