【YOLO系列】网络结构图详解

该文章已生成可运行项目,

一、YOLOv11网络结构图

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

yolo11.yaml文件讲解

参考博客:YOLO11网络结构详细解析(以n版本为例)

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv11 object detection model with P3/8-P5/32 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect

# Parameters
nc: 80  # 类别数目"number of classes",即模型用于检测的对象类别总数。由于默认使用COCO数据集所以为80;
scales: # 模型复合缩放常数,用于定义模型的不同尺寸和复杂度。例如 'model=yolov11n.yaml' 将调用带有 'n' 缩放的 yolov11.yaml
  # 参数含义:[depth, width, max_channels],depth(网络深度缩放因子)width(网络宽度缩放因子)max_channels(最大通道数)
  n: [0.50, 0.25, 1024]  # YOLOv11n概览:181层, 2624080参数, 2624064梯度, 6.6 GFLOPs
  s: [0.50, 0.50, 1024]  # YOLOv11s概览:181层, 9458752参数, 9458736 gradients, 21.7 GFLOPs
  m: [0.50, 1.00, 512]   # YOLOv11m概览:231层, 20114688参数, 20114672 gradients, 68.5 GFLOPs
  l: [1.00, 1.00, 512]   # YOLOv11l概览:357层, 25372160参数, 25372144 gradients, 87.6 GFLOPs
  x: [1.00, 1.50, 512]   # YOLOv11x概览:357层, 56966176参数, 56966160 gradients, 196.0 GFLOPs

# YOLOv11 backbone 骨干层,采用改进的CSP结构与注意力机制
backbone:
  # [from, repeats, module, args] 表示层的来源、重复次数、模块类型和参数
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2
   # 第0层,-1代表将上层的输出作为本层的输入。第0层的输入是640*640*3的图像。Conv代表卷积层,参数:64代表输出通道数,3代表卷积核大小k,2代表stride步长。卷积后输出的特征图尺寸为320*320*64,长宽为初始图片的1/2
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4
   # 第1层,进行卷积操作(128代表输出通道数,3代表卷积核大小k,2代表stride步长)。卷积后输出的特征图尺寸为160*160*128,长宽为初始图片的1/4
  - [-1, 2, C3k2, [256, False, 0.25]]  # 2
   # 第2层,本层是C3k2模块(YOLOv11特有的轻量级CSP模块),2代表本层重复2次。参数:256代表输出通道数,False表示不使用C3k子模块,0.25表示瓶颈层比例。输出的特征图尺寸为160*160*256。
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8
   # 第3层,进行卷积操作(256代表输出通道数,3代表卷积核大小k,2代表stride步长),输出特征图尺寸为80*80*256,特征图的长宽已经变成输入图像的1/8。
  - [-1, 2, C3k2, [512, False, 0.25]]  # 4
   # 第4层,C3k2模块重复2次,输出通道数512,False表示不使用C3k子模块,瓶颈层比例0.25。输出特征图尺寸为80*80*512。
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16
   # 第5层,进行卷积操作,输出通道数512,步长2,输出特征图尺寸为40*40*512,特征图的长宽已经变成输入图像的1/16。
  - [-1, 2, C3k2, [512, True]]  # 6
   # 第6层,C3k2模块重复2次,输出通道数512,True表示使用C3k子模块(增强特征提取能力)。输出特征图尺寸为40*40*512。
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32
   # 第7层,进行卷积操作,输出通道数1024,步长2,输出特征图尺寸为20*20*1024,特征图的长宽已经变成输入图像的1/32。
  - [-1, 2, C3k2, [1024, True]]  # 8
   # 第8层,C3k2模块重复2次,输出通道数1024,使用C3k子模块。输出特征图尺寸为20*20*1024。
  - [-1, 1, SPPF, [1024, 5]]  # 9
   # 第9层,本层是快速空间金字塔池化层(SPPF)。1024代表输出通道数,5代表池化核大小k。通过多尺度池化增强特征多样性,输出特征图尺寸为20*20*1024。
  - [-1, 2, C2PSA, [1024]]  # 10
   # 第10层,本层是C2PSA模块(含通道和空间注意力机制),2代表重复2次,1024代表输出通道数。通过注意力机制增强特征表达能力,输出特征图尺寸为20*20*1024。

# YOLOv11 head 头部层,采用PANet结构实现多尺度特征融合
head:
  - [-1, 1, nn.Upsample, [None, 2, "nearest"]]  # 11
   # 第11层,本层是上采样层。None代表上采样的size=None(输出尺寸)不指定。2代表scale_factor=2,表示输出的尺寸是输入尺寸的2倍。mode=nearest代表使用的上采样算法为最近邻插值算法。经过这层之后,特征图的长和宽变成原来的两倍,通道数不变,所以最终尺寸为40*40*1024。
  - [[-1, 6], 1, Concat, 
本文章已经生成可运行项目
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值