【Jupter|Pycharm】RuntimeError: DataLoader worker (pid(s) 6404) exited unexpectedly

最新推荐文章于 2025-08-18 17:32:54 发布

原创最新推荐文章于 2025-08-18 17:32:54 发布 · 795 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#pycharm #python

博客作者分享了在使用Pytorch时遇到Dataloader运行错误的经历，经过一晚上的排查，发现错误并非由batch_size引起，而是num_size。解决方案是将num_size设为0，但指出这不适用于所有Windows系统。文中还提供了详细的解答链接，以帮助遇到类似问题的开发者。

部署运行你感兴趣的模型镜像

一句话让我运行了一晚上！

很气！

报错如图，通过各种百度&优快云，终于解决了！

走了很多弯路，问题的关键不是batch_size，而是num_size

有份回答说Windows系统下要将num_size设置为0，我觉得不能以偏概全，因为我队友Windows系统下num_size为1,也正常运行了；

但对于我这个情况确实要把num_size改为0，之后就可以正常运行啦

这边有一份详细解答和分析，记录一下~

Pytorch中Dataloader踩坑：RuntimeError: DataLoader worker (pid(s) 6700, 10620) exited unexpectedly

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Q_pril

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

pytorch too many open files

Hello Word!

06-01

1782

pytorch 单机多卡训练：报错： $ sh experiments/webface/res50-bs64-sz224-ep35/train.sh Creating model on [4] gpus: 0,1,2,3 Origin Size: 493456 Aligned Size: 493568 Traceback (most recent call last): Traceback (most recent call last): File "/home/user1/miniconda

动手学深度学习8 Softmax回归+损失函数+图片分类

weixin_42831564的博客

01-26

1429

当预测值和真实值离得比较远的时候，梯度为常数，权重更新不大，会带来很多稳定性的好处【不管多远，梯度以同样的力度向中间扯】。不好的地方，0点处不可导，从-1到+1的剧烈变化，平滑性差，当预测值和真实值靠的近，优化到了末期，这里可能变得不那么稳定。橙色曲线：导数–梯度，在大于0，导数为常数1，小于0，导数-1，在0点不可导，导数在（-1,1）之间瞬间变化。当预测值和真实值差距较小，到了优化末期，梯度会越来越小，保证优化是平滑的，避免出现数值的问题。当预测值和真实值差距较小，绝对值小于等于1的时候，是平方误差。

1 条评论您还未登录，请先登录后发表或查看评论

RuntimeError: DataLoader worker (pid(s) 9528, 8320) exited unexpectedly

01-06

原文地址分类目录——Pytorch 关键词： Data.DataLoader、num_workers、batch Pytorch在开进行小批量数据下降时开多进程报错报错内容 RuntimeError: DataLoader worker (pid(s) 9528, 8320) exited unexpectedly 去网上搜教程，说是在loader定义的时候多进程的参数指定的问题，我的loader定义如下 loader = Data.DataLoader( dataset=torch_dataset, # torch TensorDataset format ba

DataLoader worker (pid(s) xxxxx) exited unexpectedly.

ajin_97的博客

04-11

1060

数据集加载问题

RuntimeError: DataLoader worker (pid(s) 4260, 18120, 14152, 12280) exited unexpectedly解决方案

weixin_45186425的博客

10-04

1841

RuntimeError: DataLoader worker (pid(s) 4260, 18120, 14152, 12280) exited unexpectedly解决方案

Docker中使用pytorch报错ERROR: Unexpected bus error encountered in worker. This might be caused by insuffi

Muzythoof的博客

03-04

2524

@[TOC](Docker中使用pytorch报错ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm).) 问题原因由于docker中shm内存不足，导致pytorch调用Dataloader时报错。 Please note that PyTorch uses shared memory to share data between process

《动手学深度学习》之深度卷积神经网络（AlexNet）

乾巽的博客

02-06

466

参考深度卷积神经网络（AlexNet） import time import torch from torch import nn, optim import torchvision import sys sys.path.append("..") import d2lzh_pytorch as d2l device = torch.device('cuda' if torch.cuda....

RuntimeError: DataLoader worker (pid(s) ***********) exited unexpectedly

teletubbies的博客

10-03

1515

File "D:\Pycharm-WorkSpace\d2l-zh-pytorch\5 卷积神经网络\5.6 深度卷积神经网络（AlexNet）.py", line 74, in File "D:\Pycharm-WorkSpace\d2l-zh-pytorch\5 卷积神经网络\5.6 深度卷积神经网络（AlexNet）.py", line 74, in # 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数。使用丢弃层来缓解过拟合。

RuntimeError: DataLoader worker (pid(s) 29167) exited unexpectedly

AnneMOMO's Blog

11-20

1107

@Pytorch| RuntimeError: DataLoader worker (pid(s) 29167) exited unexpectedly RuntimeError: DataLoader worker (pid(s) 29167) exited unexpectedly 使用pytorch多线程进行测试时，出现上述问题，我的环境是pytorch+anaconda+pycharm；出现这种问题的可能原因：cuda 虚拟环境的共享内存不足解决办法： 1、改成更小的batchsize； 2、在

在 PyCharm Notebook 中安装 YOLO

热门推荐

weixin_36670529的博客

03-07

1万+

报错 pytorch报错RuntimeError: DataLoader worker (pid(s) ... exited unexpectedly 解决因为torch.utils.data.DataLoader中设置了num_works=4，也就是多线程读取。根据其他方法，我设置num_works=1或者num_works=0都不行。最后重装了pytorch，就可以了。 pip install torch==1.5.1+cu101 torchvision==0.6.1+cu101 -

debug时出现错误： RuntimeError: DataLoader worker (pid(s) 9528, 8320) exited unexpectedly

shaojie_45的博客

10-07

790

修改：将workers_per_gpu从2修改为0，就可以正常debug了。samples_per_gpu指定一张卡里面同时训练几张图片，workers_per_gpu指定进程数，可以改成单进程的来debug。我的解决方法，找到使用的dataset对应的配置文件。比如我使用的时Pascal VOC数据集，那么在目录：configs//datasets/voc0712.py可以找到相应的配置。如果时COCO数据集则要去找其它的配置文件。问题描述：使用mmdetection，用vscode编写代码。

mmdetection踩坑1~docker内RuntimeError: DataLoader worker (pid 1727) is killed by signal: Bus errer

zlibo丶的博客

09-26

3241

今天在docker内使用mmdetection做训练时，workers_per_gpu参数设置为0时，可以正常训练。但修改配置文件中workers_per_gpu=2参数后，开始训练，程序报错：网上查资料显示，是因为docker的共享内存不足，使用命令df -h查看： shm果然很小。有两种解决办法： 1.重启docker容器，在重启docker容器时，使用 --shm...

RuntimeError: DataLoader worker (pid(s) 10188) exited unexpectedly

qq_42006303的博客

01-03

1540

错误原因：torch.utils.data.DataLoader中的num_workers错误将num_workers改为0即可，0是默认值。 num_workers是用来指定开多进程的数量，默认值为0，表示不启用多进程。地址是安装目录：D:\anaconda\Anaconda3\Lib\site-packages\torch\utils\data\dataloader.py 第189行：修改后如下： ...

【动手学深度学习】RuntimeError: DataLoader worker (pid(s) 52104, 29692, 55956, 45304) exited unexpectedly

wzk4869的博客

11-20

575

【动手学深度学习】RuntimeError: DataLoader worker (pid(s) 52104, 29692, 55956, 45304) exited unexpectedly

pycharm中RuntimeError: No CUDA GPUs are available

08-08

<think>首先，用户的问题是：“解决 PyCharm 中 RuntimeError: No CUDA GPUs are available”。这表示在PyCharm中运行代码时，遇到了CUDA错误，提示没有可用的GPU。从系统指令中，我需要： - 使用中文回答。 - 结构清晰，帮助用户逐步解决问题。 - 确保回答真实可靠。 - 在行内数学表达式中使用$...$格式，但这个问题可能不涉及数学表达式，所以可能不需要。 - 独立公式使用$$...$$格式，但同样，这里可能不需要。 - 生成相关问题。 - 在引用的段落末尾添加引用标识，如[^1]。参考引用是提供的，但它是关于另一个错误的，我需要基于用户的问题来回答。用户提供的引用是：“引用[1]:3. 使用PyCharm对测试程序进行debug时，无法正常启动运行，并且报错：RuntimeError: all tensors must be on devices[0]. 可是在服务器上直接运行时没有问题。 net = torch.nn.DataParallel(net, device_ids=[0, 1, 2, 3, 4, 5, 6, 7]).cuda() [^1]。” 但用户说：“上述引用仅供参考，并不是用户真正的需求”，所以我不能直接依赖它。用户真正的需求是解决“RuntimeError: No CUDA GPUs are available”。关键点： - 错误消息：RuntimeError: No CUDA GPUs are available - 在PyCharm中发生，但在服务器上直接运行没问题。 - 可能的原因：PyCharm环境配置问题、CUDA驱动问题、PyTorch或CUDA版本不匹配等。我需要构建一个结构化的回答： 1. **理解问题**：解释错误的原因。 2. **逐步解决**：提供解决方案的步骤。 3. **确保可靠性**：基于常见问题解决。 4. **生成相关问题**：在最后添加相关问题。步骤： 1. **检查CUDA可用性**：确保系统有CUDA GPU。 2. **验证PyTorch安装**：检查PyTorch是否支持CUDA。 3. **PyCharm配置**：检查PyTorch在PyCharm中的环境设置。 4. **其他可能原因**：如权限问题、环境变量等。常见解决方案： - 在代码中添加检查：`torch.cuda.is_available()`。 - 确保PyCharm使用正确的Python解释器（包含CUDA支持的）。 - 检查CUDA驱动版本。 - 重新安装PyTorch或CUDA工具包。由于错误发生在PyCharm调试时，但服务器运行正常，可能的原因是PyCharm的环境没有正确配置CUDA路径。回答结构： - 开头解释错误。 - 列出可能原因。 - 逐步解决方案。 - 结尾生成相关问题。生成相关问题： - 例如：如何检查CUDA是否可用？PyTorch如何配置多GPU？等。最终回答用中文。</think>### 解决 PyCharm 中 RuntimeError: No CUDA GPUs are available 当在 PyCharm 中运行深度学习代码（如使用 PyTorch）时，遇到 `RuntimeError: No CUDA GPUs are available` 错误，通常表示 PyCharm 无法检测到可用的 CUDA 设备。这可能是由于环境配置问题、驱动程序不兼容或 PyCharm 设置错误导致的。以下是一个结构化的解决方案，帮助您逐步诊断和修复问题。整个过程基于常见实践，确保可靠性和可操作性。 #### 错误原因分析 - **核心问题**：PyCharm 运行时环境无法访问 CUDA 设备，导致 GPU 加速失败。常见原因包括： - PyCharm 使用的 Python 解释器路径不正确（例如，指向了不包含 CUDA 支持的虚拟环境）。 - CUDA 驱动或 PyTorch 版本不匹配。 - 环境变量（如 `CUDA_VISIBLE_DEVICES`）未正确设置。 - 系统权限问题（如 PyCharm 未以管理员权限运行）。 - **为什么服务器直接运行正常？** 在服务器终端直接运行时，环境变量和路径可能已正确配置（如通过 `.bashrc` 加载），而 PyCharm 可能未继承这些设置[^1]。 #### 逐步解决方案按照以下步骤操作，每个步骤都包含验证方法，确保问题逐步解决。操作前，请确保您的系统已安装 NVIDIA 驱动和 CUDA 工具包（可使用 `nvidia-smi` 命令在终端检查 GPU 状态）。 1. **验证 CUDA 可用性（基础检查）** 在代码中添加简单测试，确认 CUDA 是否可用： ```python import torch print(torch.cuda.is_available()) # 输出应为 True print(torch.cuda.device_count()) # 输出可用 GPU 数量 ``` - 如果输出 `False` 或 `0`，说明 PyTorch 未检测到 GPU。 - **操作**：在 PyCharm 中运行此代码。如果输出错误，进入下一步。 2. **检查 PyCharm 的 Python 解释器设置** PyCharm 可能使用了错误的 Python 环境（例如，一个未安装 CUDA 支持的虚拟环境）。 - **步骤**： - 打开 PyCharm，转到 `File > Settings > Project: [您的项目名] > Python Interpreter`。 - 确保选中的解释器路径与服务器终端中使用的相同（可通过 `which python` 在终端查看）。 - 如果使用虚拟环境，确认该环境已安装支持 CUDA 的 PyTorch（例如，通过 `pip list | grep torch` 检查）。 - **修复**：如果解释器错误，点击下拉菜单选择正确的解释器，或创建新环境并重新安装 PyTorch（使用支持 CUDA 的版本，如 `pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu117`）。 3. **配置环境变量** PyCharm 可能未加载系统环境变量（如 `PATH` 或 `CUDA_VISIBLE_DEVICES`）。 - **步骤**： - 在 PyCharm 中，转到 `Run > Edit Configurations`。 - 在您的运行配置中，找到 `Environment variables` 字段。 - 添加以下变量（示例值）： ``` PATH=/usr/local/cuda/bin:$PATH CUDA_VISIBLE_DEVICES=0 ``` - 确保路径指向您的 CUDA 安装目录（如 `/usr/local/cuda-11.7/bin`）。 - **验证**：重启 PyCharm 并重新运行代码。如果问题依旧，检查 CUDA 版本兼容性。 4. **验证 PyTorch 和 CUDA 版本兼容性** 版本不匹配会导致 CUDA 不可用。例如，PyTorch 1.12 需要 CUDA 11.6，而 CUDA 12.x 可能不兼容。 - **步骤**： - 在终端运行 `nvcc --version` 获取 CUDA 版本。 - 在 PyCharm 的 Python 控制台中运行： ```python import torch print(torch.__version__) # PyTorch 版本 print(torch.version.cuda) # PyTorch 编译的 CUDA 版本 ``` - 比较两者：如果 CUDA 版本不一致，需重新安装匹配的 PyTorch。 - **修复**：卸载当前 PyTorch（`pip uninstall torch`），然后从 PyTorch 官网获取正确命令安装（例如，CUDA 11.7 对应 `pip install torch==1.13.1+cu117`）。 5. **检查系统权限和 PyCharm 配置** - **权限问题**：确保 PyCharm 以管理员权限运行（在 Linux/macOS 中使用 `sudo` 启动 PyCharm，或在 Windows 中右键选择“以管理员身份运行”）。 - **PyCharm 特定设置**：禁用可能干扰的插件（如某些 GPU 监控工具），转到 `Settings > Plugins` 并临时禁用非必要插件。 - **调试模式问题**：如果错误仅在调试时出现，尝试在 `Run > Edit Configurations` 中勾选 `Emulate terminal in output console`（模拟终端输出），这能更好地继承环境变量[^1]。 6. **终极修复：重新安装或降级驱动** 如果以上步骤无效，可能是驱动问题。 - **操作**： - 更新 NVIDIA 驱动：从 NVIDIA 官网下载最新驱动安装。 - 降级 PyTorch：如果服务器运行正常，复制服务器的 PyTorch 版本（通过 `pip install torch==<version>`）。 - 重装 CUDA 工具包：从 NVIDIA 官网下载并安装兼容版本。 #### 验证修复完成上述步骤后，运行一个简单的 CUDA 测试脚本： ```python import torch if torch.cuda.is_available(): device = torch.device("cuda") print(f"CUDA device: {torch.cuda.get_device_name(0)}") else: print("CUDA not available") ``` 如果输出 GPU 名称，表示问题已解决。否则，查看 PyCharm 的运行日志以获取更多错误细节。 ### 相关问题 1. 如何检查 PyTorch 是否支持 CUDA？ 2. 在 PyCharm 中如何配置多 GPU 训练？ 3. CUDA 版本不兼容时如何降级 PyTorch？ [^1]: 引用自用户提供的上下文，强调了 PyCharm 调试环境与服务器直接运行的差异，可能涉及环境变量或路径配置问题。