目标检测系列—YOLOv4 详解

最新推荐文章于 2025-10-21 21:30:52 发布

原创最新推荐文章于 2025-10-21 21:30:52 发布 · 1.1k 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #YOLO #人工智能

目标检测系列专栏收录该内容

20 篇文章

订阅专栏

目标检测系列—YOLOv4 详解

1. 引言

在前几期YOLOv1 详解、YOLOv2 详解和YOLOv3 详解中，我们介绍了 YOLO 系列的演变。YOLOv4 由 Alexey Bochkovskiy 于 2020 年发布，相比 YOLOv3 在 检测精度、推理速度 和 模型优化 方面进行了进一步改进。

YOLOv4 的主要特点包括：

CSPDarknet53 作为主干网络，提高特征提取能力。
使用 PAN（Path Aggregation Network）增强特征融合。
Mish 激活函数和 DropBlock 进行优化。
CIOU 损失改进目标框回归，提高检测精度。

本文将详细解析 YOLOv4 的 网络结构、关键改进点，并提供 PyTorch 代码示例。

2. YOLOv4 的关键改进

YOLOv4 主要在 YOLOv3 的基础上做了 4 大优化：

改进点	描述
1. 更强的主干网络	采用 CSPDarknet53 作为特征提取网络，提高计算效率
2. 更好的特征融合	采用 PAN（Path Aggregation Network）进行多尺度特征融合
3. 更优的训练策略	采用 Mish 激活函数、DropBlock、Self-Adversarial Training 等优化
4. 更先进的目标框回归	采用 CIOU 损失提高边界框预测的精度

YOLOv4 在 COCO 数据集上的 AP50 达到了 65.7%，比 YOLOv3 提高了约 10%，同时仍保持了较快的推理速度。

3. YOLOv4 的网络结构

YOLOv4 采用 CSPDarknet53 作为主干网络，并结合 PAN 进行特征融合。

3.1 CSPDarknet53 结构

输入： $416 \times 416 \times 3$ 的 RGB 图像。
特征提取：
- 采用 CSP（Cross Stage Partial Network） 结构，提高计算效率。
- 采用 Mish 激活函数 代替 Leaky ReLU，提高梯度流动性。
多尺度预测：
- 采用 PAN 结构 进行特征融合，提高检测能力。

CSPDarknet53 代码示例（PyTorch 实现）：

import torch
import torch.nn as nn

class CSPDarknet53(nn.Module):
    def __init__(self):
        super(CSPDarknet53, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1)
        self.bn1 = nn.BatchNorm2d(32)
        self.mish = nn.Mish()
        self.res_block = nn.Sequential(
            nn.Conv2d(32, 64, 3, padding=1),
            nn.BatchNorm2d(64),
            nn.Mish()
        )
    
    def forward(self, x):
        x = self.mish(self.bn1(self.conv1(x)))
        x = self.res_block(x)
        return x

model = CSPDarknet53()
print(model)

4. YOLOv4 的 PAN 结构

YOLOv4 采用 PAN（Path Aggregation Network） 进行特征融合，进一步提升目标检测能力。

PAN 代码示例（PyTorch 实现）：

class PAN(nn.Module):
    def __init__(self):
        super(PAN, self).__init__()
        self.conv1 = nn.Conv2d(256, 128, kernel_size=1)
        self.upsample = nn.Upsample(scale_factor=2, mode='nearest')
        self.conv2 = nn.Conv2d(128, 64, kernel_size=3, padding=1)
    
    def forward(self, x):
        x = self.conv1(x)
        x = self.upsample(x)
        x = self.conv2(x)
        return x

model = PAN()
print(model)

5. YOLOv4 的损失函数

YOLOv4 继续使用 CIOU（Complete IoU）损失，进一步优化目标框回归。

损失函数代码示例（PyTorch 实现）：

import torch

def ciou_loss(pred_boxes, target_boxes):
    iou = torch.sum(torch.min(pred_boxes, target_boxes)) / torch.sum(torch.max(pred_boxes, target_boxes))
    center_dist = torch.sum((pred_boxes[:, :2] - target_boxes[:, :2]) ** 2)
    aspect_ratio = torch.sum(torch.abs(pred_boxes[:, 2:] - target_boxes[:, 2:]))
    loss = 1 - iou + center_dist + aspect_ratio
    return loss