这里写目录标题
一、YOLOv11网络结构图





yolo11.yaml文件讲解
# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv11 object detection model with P3/8-P5/32 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect
# Parameters
nc: 80 # 类别数目"number of classes",即模型用于检测的对象类别总数。由于默认使用COCO数据集所以为80;
scales: # 模型复合缩放常数,用于定义模型的不同尺寸和复杂度。例如 'model=yolov11n.yaml' 将调用带有 'n' 缩放的 yolov11.yaml
# 参数含义:[depth, width, max_channels],depth(网络深度缩放因子)width(网络宽度缩放因子)max_channels(最大通道数)
n: [0.50, 0.25, 1024] # YOLOv11n概览:181层, 2624080参数, 2624064梯度, 6.6 GFLOPs
s: [0.50, 0.50, 1024] # YOLOv11s概览:181层, 9458752参数, 9458736 gradients, 21.7 GFLOPs
m: [0.50, 1.00, 512] # YOLOv11m概览:231层, 20114688参数, 20114672 gradients, 68.5 GFLOPs
l: [1.00, 1.00, 512] # YOLOv11l概览:357层, 25372160参数, 25372144 gradients, 87.6 GFLOPs
x: [1.00, 1.50, 512] # YOLOv11x概览:357层, 56966176参数, 56966160 gradients, 196.0 GFLOPs
# YOLOv11 backbone 骨干层,采用改进的CSP结构与注意力机制
backbone:
# [from, repeats, module, args] 表示层的来源、重复次数、模块类型和参数
- [-1, 1, Conv, [64, 3, 2]] # 0-P1/2
# 第0层,-1代表将上层的输出作为本层的输入。第0层的输入是640*640*3的图像。Conv代表卷积层,参数:64代表输出通道数,3代表卷积核大小k,2代表stride步长。卷积后输出的特征图尺寸为320*320*64,长宽为初始图片的1/2
- [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
# 第1层,进行卷积操作(128代表输出通道数,3代表卷积核大小k,2代表stride步长)。卷积后输出的特征图尺寸为160*160*128,长宽为初始图片的1/4
- [-1, 2, C3k2, [256, False, 0.25]] # 2
# 第2层,本层是C3k2模块(YOLOv11特有的轻量级CSP模块),2代表本层重复2次。参数:256代表输出通道数,False表示不使用C3k子模块,0.25表示瓶颈层比例。输出的特征图尺寸为160*160*256。
- [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
# 第3层,进行卷积操作(256代表输出通道数,3代表卷积核大小k,2代表stride步长),输出特征图尺寸为80*80*256,特征图的长宽已经变成输入图像的1/8。
- [-1, 2, C3k2, [512, False, 0.25]] # 4
# 第4层,C3k2模块重复2次,输出通道数512,False表示不使用C3k子模块,瓶颈层比例0.25。输出特征图尺寸为80*80*512。
- [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
# 第5层,进行卷积操作,输出通道数512,步长2,输出特征图尺寸为40*40*512,特征图的长宽已经变成输入图像的1/16。
- [-1, 2, C3k2, [512, True]] # 6
# 第6层,C3k2模块重复2次,输出通道数512,True表示使用C3k子模块(增强特征提取能力)。输出特征图尺寸为40*40*512。
- [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
# 第7层,进行卷积操作,输出通道数1024,步长2,输出特征图尺寸为20*20*1024,特征图的长宽已经变成输入图像的1/32。
- [-1, 2, C3k2, [1024, True]] # 8
# 第8层,C3k2模块重复2次,输出通道数1024,使用C3k子模块。输出特征图尺寸为20*20*1024。
- [-1, 1, SPPF, [1024, 5]] # 9
# 第9层,本层是快速空间金字塔池化层(SPPF)。1024代表输出通道数,5代表池化核大小k。通过多尺度池化增强特征多样性,输出特征图尺寸为20*20*1024。
- [-1, 2, C2PSA, [1024]] # 10
# 第10层,本层是C2PSA模块(含通道和空间注意力机制),2代表重复2次,1024代表输出通道数。通过注意力机制增强特征表达能力,输出特征图尺寸为20*20*1024。
# YOLOv11 head 头部层,采用PANet结构实现多尺度特征融合
head:
- [-1, 1, nn.Upsample, [None, 2, "nearest"]] # 11
# 第11层,本层是上采样层。None代表上采样的size=None(输出尺寸)不指定。2代表scale_factor=2,表示输出的尺寸是输入尺寸的2倍。mode=nearest代表使用的上采样算法为最近邻插值算法。经过这层之后,特征图的长和宽变成原来的两倍,通道数不变,所以最终尺寸为40*40*1024。
- [[-1, 6], 1, Concat,

最低0.47元/天 解锁文章
8121

被折叠的 条评论
为什么被折叠?



