如何解决pjreddie版darknet不能使用cudnn8编译的问题

原创

已于 2022-05-12 21:57:33 修改 · 9.6k 阅读

103 ·

CC 4.0 BY-SA版权

文章标签：

#darknet #神经网络 #深度学习 #yolov3 #pjreddie

于 2021-01-18 20:07:15 首次发布

本文对比了两种不同的Darknet版本在JetsonNano平台部署YoloV3Tiny网络的表现差异，并详细记录了解决在RTX3090GPU上编译PJReddie版Darknet遇到的问题的过程。

近期使用同样的数据同样的yolov3 tiny网络配置文件实验对比了GitHub - pjreddie/darknet: Convolutional Neural Networks和https://github.com/AlexeyAB/darknet，发现使用两者训练出来的weights文件拿到Jetson Nano上去嵌入到deepstream中使用(网络cfg文件是一样的)，用来做视频识别，发现实际表现上，两者训练出来的weights导致模型的精度和召回率相差很大，Alexey版明显比pjreddie差很多，一下想不出准确原因在哪，或许是因为目前版本的deepstream中内置的基于TensorRT实现的yolov3(/tiny)是完全与pjreddie的实现保持一致的？(原因已查明，deepstream内在调用模型做识别时，当模型内部有定制层用plugin实现时，cuda stream必须和模型的其他层使用同一个，不能内部自行再创建或者不传入cuda stream使用tensorrt内部默认的stream，另外deepstream在后处理metadata过滤bbox时有个bug，报给了NVIDIA)。

之前在RTX3090 GPU server上使用pjreddie版的darknet面临一个左右为难的问题，RTX3090 GPU只能使用CUDA11.x才能跑得正常，但是没有与CUDA11.x对应的cudnn7.x，而pjreddie版的darknet的代码比较老旧了，依赖于cudnn7.x，所以在一个CUDA11.1+cudnn8.x的环境下编译pjreddie版的darknet的话，修改Makefile，设置:

GPU=1
CUDNN=1
OPENCV=1

后，一执行make就报错：

&nbs

最低0.47元/天解锁文章

42 条评论

onecollins 2023.01.29
将代码替换后仍然报错，3090的显卡，cuda版本没问题，各种方法都试了还是报这个错误，博主能指导下吗
- Arnold-FY-Chen回复onecollins 2023.01.30
  编译错误？你确认你编译的代码是你修改过的代码吗？如果是修改了代码编译还报这个错误十有八九是配置里的路径不对

DreamNotOver 2022.08.25
修改后cpu版编译出错，gpu版还是cmake时找不到cuda，编译失败。
- Arnold-FY-Chen回复DreamNotOver 2023.01.30
  这很明显是你环境配置有问题，不是代码问题

June7_ 2022.05.12
大家直接把这个链接的代码覆盖出问题的出问题的那个文件就行了。 https://github.com/arnoldfychen/darknet/blob/master/src/convolutional_layer.c
- Wayne_Fine回复June7_ 2025.02.06
  感谢大佬！！！
- qq_59069001回复June7_ 2023.08.04
  谢谢大佬
- 金焱111回复June7_ 2022.08.08
  这个链接消失了
- Arnold-FY-Chen回复June7_ 2022.05.12
  对

工程师20014 2022.05.03
你的显卡30多少，我的3090还不行
- Arnold-FY-Chen回复工程师20014 2022.05.03
  准确的说，3090卡需要使用CUDA11.1.1以上才能正常工作，如果您的CUDA版本低于这个，那么需要安装更高的版本，如果已经是比较高的版本，还报错，那么看错误是否是darknet里报错来的，是不是代码不小心没改正确，如果不是darknet报的错或者根本没有错误信息，但是检测不到目标，那得检查其他方面的原因了

r i c k 2022.04.20
谢谢，根据博客修改后成功运行，并能检测到目标。

r i c k 2022.04.20
... cudnnGetConvolutionBackwardFilterAlgorithm(cudnn_handle(), l->srcTensorDesc, l->ddstTensorDesc, l->convDesc, l->dweightDesc, CUDNN_CONVOLUTION_BWD_FILTER_SPECIFY_WORKSPACE_LIMIT, 2000000000, &l->bf_algo); #endif #endif #endif }

r i c k 2022.04.20
error: ‘MEMORY_LIMIT’ undeclared (first use in this function) 解决方法： #define PRINT_CUDNN_ALGO 0 #define MEMORY_LIMIT 2000000000
- r i c k回复金焱111 2022.08.12
  时间太久了，没记错的话是加到src/convolutional_layer.c文件第4行，这个博文里面也有写
- 金焱111回复r i c k 2022.08.08
  这个应该加到哪里