pytorch yolo3 代码运行时报错

最新推荐文章于 2025-03-06 11:03:14 发布

秦耘

最新推荐文章于 2025-03-06 11:03:14 发布

阅读量742

点赞数 1

分类专栏：错误集锦

本文链接：https://blog.youkuaiyun.com/QINJINWX/article/details/104167394

版权

错误集锦专栏收录该内容

5 篇文章

订阅专栏

pytorch yolo3 代码运行时报错
torch._C._cuda_init()
RuntimeError: CUDA error: unknown error
解决：
在import后边加上下边一句：torch.cuda.current_device() 运行通过
import torch
torch.cuda.current_device()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

秦耘

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

汇总利用YOLO11训练遇到的报错和解决方案（包含训练过程中验证阶段报错、精度报错、损失为Nan、不打印GFLOPs）

Snu77的博客

11-05

2596

本文为专栏内读者和我个人在训练YOLOv11时遇到的各种错误解决方案你遇到的问题本文基本上都能够解决，同时本文的内容为持续更新，定期汇总大家遇到的问题已经一些常见的问题答案，目前包含的问题已经解决方法汇总如下图所示。YOLOv11改进系列专栏——本专栏持续复习各种顶会内容——科研必备目录一、本文介绍二、报错问题(1)训练过程中loss出现Nan值.(2)多卡训练问题,修改模型以后不能支持多卡训练可以尝试下面的两行命令行操作，两个是不同的操作，是代表不同的版本现尝试第一个不行用第二个。

汇总利用YOLO10训练遇到的报错和解决方案（包含训练过程中验证阶段报错、精度报错、损失为Nan、不打印GFLOPs）

Snu77的博客

07-14

1575

本文为专栏内读者和我个人在训练YOLOv10时遇到的各种错误解决方案，你遇到的问题本文基本上都能够解决，同时本文的内容为持续更新，定期汇总大家遇到的问题已经一些常见的问题答案，目前包含的问题已经解决方法汇总如下图所示。YOLOv10改进系列专栏——本专栏持续复习各种顶会内容——科研必备目录一、本文介绍二、报错问题(1)训练过程中loss出现Nan值.(2)多卡训练问题,修改模型以后不能支持多卡训练可以尝试下面的两行命令行操作，两个是不同的操作，是代表不同的版本现尝试第一个不行用第二个。

1 条评论您还未登录，请先登录后发表或查看评论

pytorch的一种RuntimeError

qq_38420683的博客

10-19

1831

问题 GNN训练时候，突然报错 mask = mask.div(num_neigh).to(embed_matrix.device) RuntimeError: CUDA error: unspecified launch failure 准备重启试试，但 torch._C._cuda_init() RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing

torch._C._cuda_init() RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected

onlyforbest的博客

10-18

7820

1、一个月不用云服务器就报了个大错（整个人都不好了，之前还用的好好的，现在就凉了）： torch._C._cuda_init() RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected at /pytorch/aten/src/THC/THCGeneral.cpp:50 2、寻找解决方法：第一篇参考博客： https://blog.youkuaiyun.com/hangzuxi8764/article/d

深度学习报错“Compile with TORCH_USE_CUDA_DSA to enable device-side assertions”解决方法

xxiaot的博客

03-06

3394

在使用PyTorch进行深度学习模型训练时，尤其是依赖GPU加速的情况下，偶尔会遇到一些与CUDA相关的错误提示。最近我在训练模型时，就碰到了一个这样的报错：Compile with ‘TORCH_USE_CUDA_DSA’ to enable device-side assertions.这个错误是在调用进行反向传播时触发的。经过一番排查，我发现问题的根源是GPU显存不足，最终通过降低batch_size解决了这个报错。今天，我就把这个问题的分析和解决过程分享出来，希望能帮到遇到类似问题的朋友！

RuntimeError: CUDA error: unknown error

这个年纪的_我

07-20

1033

增加一行 torch.cuda.current_device()

matlab调用python程序运行报错：import error: from torch._C import * RuntimeError: stoi的问题解决

一个菜鸟的奋斗

08-14

1838

这几天在使用vot toolkit评测自己的跟踪器，需要在matlab里面调用python的跟踪器代码，其中用到了pytorch的库。运行的时候报错，“import error: from torch._C import * RuntimeError: stoi”，搞了好久才解决。查了一些资料，显示这个问题是pytorch版本导致的，如果使用Torch 0.3.*则没有这个问题。但是将pytorc...

求助：RuntimeError: CUDA error: unknown error

weixin_45273354的博客

07-08

649

以前能跑完训练的代码，上周开始跑到一半就会报错，batch_size调小了一半也不行。

【Pytorch】PytorchCPU版或GPU报错异常处理（10X~4090D）

Loi_Chairmanの博客

04-20

2659

通过以上应用基本上能够解决Pytorch因为清华源错误安装成为CPU版本，或者其他原因想换成GPU版本的难题。也能适用于一些GPU版本下显示无法使用GPU，检验得到false，甚至import torch报错根本进不去检测页面的问题。换到GPU上用4090d跑是真的迅速又开心！希望大家的烦恼也能顺利解决√

汇总利用YOLO8训练遇到的报错和解决方案（包含训练过程中验证阶段报错、精度报错、损失为Nan、不打印GFLOPs）

Snu77的博客

02-22

4605

这也是模型打印两次的区别，第一次打印出来的就是你选择模型的yaml文件结构，第二次打印的就是替换了你数据集的yaml文件，模型使用的是第二种。(2)多卡训练问题,修改模型以后不能支持多卡训练可以尝试下面的两行命令行操作，两个是不同的操作，是代表不同的版本现尝试第一个不行用第二个。这里是我早期写的一个环境搭建的教程，大家可以参考。

YOLO8训练遇到的各种报错及解决方案

专注于图像领域，主要研究内容包括计算机视觉和深度学习，特别是在图像分类、目标检测和图像生成等方面有深入的研究和实践经验。

08-06

1373

在Windows系统中，由于其多进程模型的特殊性，使用多进程加载数据时经常会遇到问题。在Linux系统中，通常可以使用多个子进程进行数据加载，但在Windows系统中必须将进程数设置为单进程来避免错误。此问题可能是当前使用的GPU正在被其他应用程序占用，导致显存不足。需要关闭其他应用程序以释放显存。这是由于Pillow版本问题，最新的10.0版本会产生上述问题。虽然调整后会在一定程度上影响模型的泛化能力并容易导致过拟合，但在必要时可以将。降低PyTorch和CUDA版本。使用device指定GPU。

cuda报错, RuntimeError: CUDA error: unknown error

热门推荐

g534441921的博客

05-09

2万+

转自：Pytorch 常见问题苦恼了一下午，再次感谢作者！ cuda报错, RuntimeError: CUDA error: unknown error File "D:\ProgramFiles\ProgramFiles\anaconda\lib\site-packages\torch\nn\modules\module.py", line 384, in convert return t.to(device, dtype if t.is_floating_point() else Non

如何解决RuntimeError: No CUDA GPUs are available

qq_44138217的博客

11-20

2526

在终端（python环境且导入了torch）输入以下代码。如果以上没用则可以采用以下方法。使用xxx.cuda前输入。

debug——偶发报警：RuntimeError: CUDA error: unknown error

wxsy024680的博客

06-29

3527

2、并发问题：如果您的代码中涉及到多个线程或进程同时使用GPU资源，那么可能会发生并发问题。例如，如果您的数据集中存在异常值或不一致的数据，可能会导致CUDA错误。2、检查代码中的并发问题：如果您的代码涉及到多个线程或进程同时使用GPU资源，请确保您正确地同步和管理GPU资源的访问。4、检查硬件问题：如果您怀疑是硬件问题导致的CUDA错误，可以尝试在其他计算机或使用其他GPU上运行代码进行测试。4、硬件问题：某些CUDA错误可能是由于硬件问题导致的，例如GPU故障或不稳定的电源供应。

成功解决\torch\cuda_init_.py“, line 239,AssertionError(“Torch not compiled with CUDA enabled“)

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

06-15

1917

成功解决\torch\cuda_init_.py", line 239, in _lazy_init raise AssertionError("Torch not compiled with CUDA enabled") 目录解决问题解决思路解决方法解决问题 \torch\cuda_init_.py", line 239, in _lazy_init raise AssertionError("Torch not compiled with CUDA enable

RuntimeError:CUDA error:unknown error

tyler的博客

03-07

8118

运行A程序时，出现如下错误。考虑原因：A程序在语料库ATIS中运行过，没有发生问题，但是之后运行了另一个程序B时，修改过gpu，如下所示： os.environ["CUDA_VISIBLE_DEVICES"] = "0" 如今在语料库Snips上运行A程序，却发生以下错误：因此认为是GPU没有选择好，在A程序的main函数中添加一行程序后，顺利解决： torch.cuda.current_d...

【实验记录】cuda运行报错RuntimeError: CUDA unknown error

liwei33660的博客

10-19

5247

实验室服务器因风扇问题，管理员重启后，运行代码出现以下错误： RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero. 尝试查看torch.cuda.is_avail

cuda()报错

qq_37802410的博客

03-24

716

在代码import torch后加上 torch.cuda.current_device() 即可解决问题

错误：RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and

代码讲故事

03-04

1万+

电脑部署大模型python运行程序出现错误：RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx

yolo11修改损失函数报错AttributeError: module 'torch' has no attribute 'OutOfMemoryError' 为什么

最新发布

03-24

<think>嗯，用户遇到了在YOLOv11中修改损失函数时出现的PyTorch的AttributeError错误，具体是module 'torch'没有'OutOfMemoryError'属性。我需要先理解这个问题可能的根源。首先，用户提到之前代码可以训练，但换了模型后出现这个错误。可能的触发点包括PyTorch版本问题、自定义损失函数中的错误，或者显存不足导致的问题。报错信息显示torch没有OutOfMemoryError属性，这说明可能在代码中有人尝试捕获显存不足的异常，但使用了错误的异常类。 PyTorch中的内存错误通常是运行时错误，比如CUDA out of memory，这时候应该捕获RuntimeError，而不是使用torch.OutOfMemoryError，因为PyTorch并没有这个异常类。所以用户可能在异常处理部分错误地引用了这个不存在的属性。接下来，用户修改了损失函数，可能在自定义损失函数的过程中引入了某些错误，比如使用了不正确的张量操作，导致显存泄漏，从而触发CUDA内存不足。这时候，原本的异常处理代码尝试捕获一个不存在的异常类型，导致AttributeError。解决方案应该包括两部分：修正异常处理代码，将torch.OutOfMemoryError改为RuntimeError；同时检查自定义损失函数的实现，确保没有内存泄漏或计算错误。此外，用户可能需要调整batch size或清理缓存来释放显存。另外，引用中的其他错误比如BrokenPipeError和分布式训练的问题可能无关，但需要确保用户的训练环境配置正确，比如PyTorch版本和依赖库是否兼容。建议用户检查代码中的异常处理部分，特别是try-except块，是否有误用的异常类，并验证损失函数的实现是否符合PyTorch的张量操作规范。</think>针对YOLOv11修改损失函数时出现的PyTorch AttributeError问题，以下是逐步解决方案： ### 错误分析报错`AttributeError: module 'torch' has no attribute 'OutOfMemoryError'`的直接原因是代码中错误地调用了`torch.OutOfMemoryError`属性。PyTorch的显存溢出错误实际会抛出**`RuntimeError`**类型，并通过错误信息`CUDA out of memory`标识[^1][^4]。 ### 解决方案 #### 步骤1：修正异常捕获逻辑检查代码中是否包含以下错误写法： ```python try: # 训练代码 except torch.OutOfMemoryError: # 错误写法 ... ``` 应修改为捕获`RuntimeError`并筛选特定错误信息： ```python try: # 训练代码 except RuntimeError as e: if "CUDA out of memory" in str(e): print("显存不足，请减小batch size") else: raise e ``` #### 步骤2：检查损失函数实现若修改损失函数后出现此错误，需排查： 1. **张量计算维度错误**：检查损失函数中矩阵运算的维度是否匹配，例如`torch.sum()`或`torch.matmul()`的维度设置 2. **梯度未释放**：在循环训练中确认是否遗漏`optimizer.zero_grad()` 3. **显存泄漏**：使用`torch.cuda.empty_cache()`手动释放缓存 #### 步骤3：显存优化措施 - 减小`batch_size` - 使用更小的输入分辨率 - 添加梯度裁剪： ```python torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0) ``` - 使用混合精度训练： ```python scaler = torch.cuda.amp.GradScaler() with torch.autocast(device_type='cuda', dtype=torch.float16): outputs = model(inputs) loss = criterion(outputs, targets) scaler.scale(loss).backward() scaler.step(optimizer) scaler.update() ``` ### 补充验证通过以下命令可监控显存使用情况： ```python print(torch.cuda.memory_allocated() / 1024**2, "MB used") # 当前张量占用显存 print(torch.cuda.memory_reserved() / 1024**2, "MB reserved") # 缓存分配器持有显存 ```