YOLO的网络结构(一)

本文介绍了YOLO的网络结构,分为图片输入、Darknet-53基础网络和三个检测分支。Y1、Y2、Y3分别针对不同大小的目标检测,通过上采样和特征拼接实现。通道数255对应类别数、坐标和置信度。网络结构中包含卷积块、残差块和上采样操作。此外,文章还讲解了卷积层的工作原理、步长和填充,以及池化层和全连接层的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

YOLO的网络结构(一)

其网络结构能分为三部分。
第一部分:图片的输入
第二部分:基础网络。作者原文使用的是 Darkjnet-53 without FC layer。
第三部分:yolo v3的三个分支。y1(13x13x255),y2(26x26x255),y3(52x52x255)。

Y1从上面结点获取。是最高层的,最抽象的特征。适合比较大的目标检测;
Y2是在Y1的基础上做一个上采样+一个低层的一个特征进行连接(concat)。
适合中等的目标检测;
Y3是在Y2的基础上做一个上采样+一个更低层的一个特征进行连接(concat)。适合小 目标的检测。

三个尺度的输出皆是奇数,使得网格会有个中心位置。

通道数255:{[80(coco数据集共有80类)+[X+Y+W+H+Confiderce]}×3(anchor) = 255

在这里插入图片描述

CBL为卷积块:由conv2d,Batch Normalization,Leaky relu 这三个网络层组成。
Res为残差块:包含两个卷积块和一个add层,add层只是将相同维度的张量进行相加。
ResX为多个残差块,X代表残差块的个数。
上采样;将特征图的宽和高变成原来的两倍,通道数不变。
Concat张量拼接:相同宽和

### YOLO网络结构详解 YOLO(You Only Look Once)是种实时目标检测算法,其核心理念是将目标检测视为单的回归问题。以下是关于YOLO网络的主要组成部分及其功能的详细介绍: #### 1. 基础网络架构 YOLO系列的不同版本均采用了改进的基础骨干网络来提取图像特征。例如,YOLOv8基于CSPNet构建[^1]。CSPNet(Cross Stage Partial Network)通过优化计算图的方式解决了大型卷积网络中的重复梯度问题,从而减少了模型参数和FLOPs,使模型更加轻量化并保持较高的速度。 #### 2. 特征融合网络 PAFPN 为了进步增强特征表达能力,YOLO引入了路径聚合特征金字塔网络(Path Aggregation Feature Pyramid Network, PAFPN)。PAFPN结合自顶向下的上采样路径和自底向上的下采样路径,实现了多层次特征的有效融合,显著提升了小物体检测性能。 #### 3. 正负样本分配策略 SimOTA 在训练过程中,YOLOX提出了SimOTA(Simplified Optimal Transport Assignment),用于高效地完成正负样本匹配。SimOTA是从OTA(Optimal Transport Assignment)简化而来的种方法,能够在不增加过多计算开销的情况下提高检测精度。实验表明,在YOLOv3的基础上应用SimOTA可提升AP约2.3个百分点[^2]。 #### 4. 多头注意力机制 PSAblock 部分YOLO变体还集成了多头注意力模块以捕捉全局上下文信息。具体来说,在PSAblock中利用了多头注意力以及由两层1×1卷积组成的前馈神经网络FFN。这种设计允许模型动态调整权重分布,并支持灵活配置是否启用残差连接[^3]。 ```python import torch.nn as nn class FFN(nn.Module): def __init__(self, channels_in, channels_out): super(FFN, self).__init__() self.conv1 = nn.Conv2d(channels_in, channels_out, kernel_size=1) self.relu = nn.ReLU() self.conv2 = nn.Conv2d(channels_out, channels_out, kernel_size=1) def forward(self, x): out = self.conv1(x) out = self.relu(out) out = self.conv2(out) return out + x if hasattr(self, 'residual') and self.residual else out ``` 上述代码片段展示了如何实现简单的前馈神经网络作为PSAblock的部分。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值