yolov4论文解读和训练自己数据集

原创已于 2022-09-02 10:19:25 修改 · 4.8k 阅读

25 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #神经网络

于 2020-04-26 00:44:01 首次发布

目标检测专栏收录该内容

10 篇文章

订阅专栏

YOLOv4在目标检测领域展现出了显著的性能提升，尤其在小目标识别方面，相较于YOLOv3和EfficientDet系列，其平均精度(AP)和帧率(FPS)分别提高了10%和12%。在车轮识别数据集上的测试显示，YOLOv4不仅缩短了处理时间，还显著提升了识别准确率。

部署运行你感兴趣的模型镜像

前天YOLOv4终于问世——

YOLO v4 论文：https://arxiv.org/abs/2004.10934

YOLO v4 开源代码：GitHub - AlexeyAB/darknet: YOLOv4 / Scaled-YOLOv4 / YOLO - Neural Networks for Object Detection (Windows and Linux version of Darknet )

效果相比YOLOv3和去年的EfficientDet系列提升明显。这里使用tensorflow model的测试图片对官方给出的COCO数据集训练的模型测试对比：

分别是YOLOv3和YOLOv4的测试结果，可以看到提升还是很明显的，特别是小目标的识别效果，不枉论文吹B的：

Improves YOLOv3’s AP and FPS by 10% and 12%, respectively

论文细节还在研究中，后面有空更新。我也第一时间使用YOLOv4训练了自己数据集。

具体的步骤和YOLOv3一模一样，需要下载backbone的权重：GitHub - AlexeyAB/darknet: YOLOv4 / Scaled-YOLOv4 / YOLO - Neural Networks for Object Detection (Windows and Linux version of Darknet )中for yolov4.cfg, yolov4-custom.cfg (162 MB)。

因为我没有梯子，能下载的兄弟请传个百度网盘分享交流。这里在网上只能找到别人分享的yolov4.weights文件，于是提取了yolov4.weights模型的backbone参数作为backbone部分的预训练模型。

训练自己数据集只需要修改yolov4-custom.cfg中三处的：

[convolutional]
size=1
stride=1
pad=1
filters=${3×(自己数据集类别+5)}  #例如COCO是3×（80+5）=255
activation=linear


[yolo]
mask = 3,4,5
anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
classes=${自己数据集类别}  #例如COCO是80
num=9
jitter=.3
ignore_thresh = .7
truth_thresh = 1
scale_x_y = 1.1
iou_thresh=0.213
cls_normalizer=1.0
iou_normalizer=0.07
iou_loss=ciou
nms_kind=greedynms
beta_nms=0.6

详细准备工作参考YOLO: Real-Time Object Detection中Training YOLO on VOC章节。

准备好后既可以开始训练：

训练过程：

这里使用车轮识别数据集对比YOLOv3和YOLOv4：

Model	AP for Body	AP for Wheel	mAP	time
YOLOv3	0.999322235707	0.88200726583	0.940664750768	12.47s/532images
YOLOv4	0.998358289307	0.948024870726	0.973191580016	12.00s/532images
YOLOv3 with Mosaic	0.99807091697	0.888338772271	0.943204844621	13.00s /532 imags

可以看到，在完全相同的训练数据和测试数据集上，YOLOv4提升效果非常明显！更短的时间，到达好的识别效果，特别是小目标识别效果。对YOLOv3使用YOLOv4中的马赛克增强处理，对识别也有0.3%的提升，特别是小目标的识别上。

对恶劣条件下的车轮测试对比：

可以看到，YOLOv4相比YOLOv3提升非常明显，特别是小目标的识别效果。

YOLOv4网络结构

TensorRT模型对比

这里对比YOLOv3和YOLOv4在darknet和tensorrt模型下的实验：

model	framework	time	GPU Mem
YOLOv3	darknet	27.575	1809MiB
YOLOv3 - pruned 99%	darknet	6.446	685MiB
YOLOv4	darknet	27.572000 ms	1333MiB
YOLOv4	tensorrt-fp32	25 ms	1145MiB
YOLOv4	tensorrt-fp16	10 ms	721MiB

可以看到YOLOv4和YOLOv3的推理速度相差不大，实际显存消耗降低明显，tensorrt可以有效降低显存消耗和推理时间。

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

16 条评论

快乐皇子 2020.12.25
数据集可以发一下吗，博主

lmw0320 2020.07.06
这里好多人，感觉都没说清楚。。。cfg文件中有很多filters，需要修改的filters位置在[yolo]上方的那个convolutional（有三处yolo） -因为yolo有3个输出头，每个头的通道数都是3 * （5+ num_classes），原始的cfg文件是用的COCO数据集，其有80类，因此filters是255（所以，也可以搜索255这个数值（三处地方），将其更改成你自己的数值--即3 * （5 + num_classes))。。。同时[yolo]下方的classes要改成自己的类别数，才方便模型根据你自己的数据设定相应的通道数。。

huzhuolei 2020.06.26
请问博主你有多少classes？多少图片？训练了多久？电脑什么配置呀？
- MidasKing回复huzhuolei 2020.06.28
  [reply]huzhuolei[/reply]训练过几个数据集:(1) 2类 2700+张数据，大约五个小时内吧（2）85类 9万多数据，大约4天；上面都是在4块泰坦X上训练的。

YP_67689E4F 2020.06.23
请问那个loss的图是怎么画的呀，加了-map,也试了./darknet detector map data/obj.data yolo-obj.cfg backup\yolo-obj_7000.weights
- MidasKing回复YP_67689E4F 2020.06.23
  [reply]YP_67689E4F[/reply]yolov4这个训练的时候默认设置会画loss图.

weixin_43167052 2020.05.28
博主，你好，请问训练过程中的log，每一行开头都是v3，正常么，以为是训练yolov3[code=plain] r: (iou: 0.07, cls: 1.00) Region 161 Avg (IOU: 0.426599, GIOU: 0.384494), Class: 0.505195, Obj: 0.522576, No Obj: 0.488485, .5R: 0.285714, .75R: 0.047619, count: 21, class_loss = 109.963615, iou_loss = 0.146271, total_loss = 110.109886 v3 (iou loss, Normalizer: (iou: 0.07, cls: 1.00) Region 139 Avg (IOU: 0.282842, GIOU: 0.164998), Class: 0.573776, Obj: 0.425067, No Obj: 0.433545, .5R: 0.052632, .75R: 0.000000, count: 19, class_loss = 1390.705566, iou_loss = 1.668701, total_loss = 1392.374268 v3 (iou loss, Normalizer: (iou: 0.07, cls: 1.00) Region 150 Avg (IOU: 0.406585, GIOU: 0.319446), Class: 0.554918, Obj: 0.523124, No Obj: 0.534845, .5R: 0.309524, .75R: 0.047619, count: 42, class_loss = 515.265808, iou_loss = 1.231201, total_loss = 516.497009 v3 (iou loss, Normalizer: (iou: 0.07, cls: 1.00) Region 161 Avg (IOU: 0.404241, GIOU: 0.343944), Class: 0.477870, Obj: 0.516634, No Obj: 0.489982, .5R: 0.318182, .75R: 0.045455, co [/code]
- weixin_43167052回复MidasKing 2020.05.28
  . ok 感谢
- MidasKing回复weixin_43167052 2020.05.28
  [reply]weixin_43167052[/reply]正常

Mike-H 2020.05.25
博主，可以分享一下代码吗
- MidasKing回复Mike-H 2020.05.28
  [reply]QLBFA[/reply]https://github.com/AlexeyAB/darknet 代码就是用的原作者开源的，tensorRT工程见作者的Readme

一名不会算法的在职算法工程师 2020.05.20
make编译时报错： [code=python] make编译时报错： collect2:error:ld returned 1 exit status Makefile:159: recipe for target 'darknet' failed make : *** [darknet] Error 1 [/code]
- MidasKing回复一名不会算法的在职算法工程师 2020.05.20
  [reply]qq_35874169[/reply]贴一下报错信息在你发的上面

程序媛-kaka 2020.04.28
YOLOv4会处理小目标分辨率低的问题吗？
- MidasKing回复程序媛-kaka 2020.04.28
  [reply]dyhdengyahui[/reply]Yolov3的多尺度训练和FPN多尺度特征融合都可以提升小目标的识别。看你具体多小了，YOLOV4在v3上改进主要增加了很多的调参和优化技巧