yolo使用gpu识别不出检测框

RTX1650 GPU识别问题：CUDNN_HALF关闭策略

原创已于 2022-08-08 11:43:23 修改 · 5.3k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2022-08-08 11:42:47 首次发布

部署运行你感兴趣的模型镜像

项目场景：

操作系统：windows10
硬件设备：RTX1650(其他可能出现该问题的显卡：游戏本显卡1650,1660以及1660Ti)

yolo系列运行成功后，在cpu中能跑出检测框来，gpu中识别不出检测框。
c语言代码：

darknet_no_gpu.exe detect yolov3.cfg yolov3.weights dog.jpg

cpu用时:1148.185000 milli-seconds.

darknet.exe detect yolov3.cfg yolov3.weights dog.jpg

gpu用时:517.685000 milli-seconds.

python语言代码：

python detect.py --weights yolov7.pt --source bus.jpg --no-trace --device cpu

cpu用时:(720.1ms) Inference

python detect.py --weights yolov7.pt --source bus.jpg --no-trace

gpu用时:(231.3ms) Inference

猜测原因：RTX1650没有达到CUDNN_HALF使用要求

总结：需要关闭CUDNN_HALF
一、yolov3;Visual Studio 2019;c语言

二、yolov7;PyCharm Community Edition 2021;python语言
在主函数中添加：

torch.backends.cudnn.enabled = False

您可能感兴趣的与本文相关的镜像

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

qq_40051802 2023.01.05
torch.backends.cudnn.enabled = False改成cudnn.benchmark = True同样实现，速度不变
- 三只羊~回复qq_40051802 2024.03.13
  老哥，稳[face]emoji:062.png[/face]
- qq_40859621回复qq_40051802 2023.11.15
  后来才看到这个，的确这样会更好，不然没有用cudnn，会降低速度。厉害[face]emoji:062.png[/face]

zjq634359531 2022.08.19
我一直还纳闷，我用cmake生成darknet.exe 可以正常检测出目标的，用vs编译的就不行，后来才发现cmake的没有勾选cudnn_half,但是vs里预编译器有。果然就是cudnn_half和显卡的问题