爆改YOLOv8|利用yolov10的SCDown改进yolov8-下采样

最新推荐文章于 2025-01-20 20:12:11 发布

原创

最新推荐文章于 2025-01-20 20:12:11 发布

· 1.7k 阅读

9 ·

版权

文章标签：

#YOLO #yolov8 #pytorch #目标检测 #计算机视觉

1, 本文介绍

YOLOv10 的 SCDown 方法来优化 YOLOv8 的下采样过程。SCDown 通过点卷积调整通道维度，再通过深度卷积进行空间下采样，从而减少了计算成本和参数数量。这种方法不仅降低了延迟，还在保持下采样过程信息的同时提供了竞争性的性能。

关于SCDown 的详细介绍可以看论文：https://arxiv.org/pdf/2405.14458

本文将讲解如何将SCDown 融合进yolov8

话不多说，上代码！

2，将SCDown 融合进yolov8

2.1 步骤一

找到如下的目录'ultralytics/nn/modules'，然后在这个目录下创建一个SCDown.py文件，文件名字可以根据你自己的习惯起，然后将SCDown的核心代码复制进去


import torch
import torch.nn as nn
 
 
__all__ = ['SCDown']
 
def autopad(k, p=None, d=1):  # kernel, padding, dilation
    """Pad to 'same' shape outputs."""
    if d > 1:
        k = d * (k - 1) + 1 if

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

不想敲代码！！！

关注关注

20
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

YOLOv8改进：利用SCDown进行下采样

走向CTO的路上...

07-15

2597

YOLOv8 是目前最先进的目标检测算法之一，但仍存在一些可以改进的地方。本文介绍一种利用 YOLOv10 提出 SCDown 下采样方法改进 YOLOv8 的方案。利用 SCDown 下采样改进 YOLOv8 可以有效降低模型的计算成本和参数数量，同时保持模型的精度，使其更适用于轻量级目标检测应用。

YOLOv5改进 | Conv篇 | 利用YOLOv10提出的SCDown魔改YOLOv5进行下采样（附代码 + 结构图 + 添加教程）

Snu77的博客

06-05

1804

本文给大家带来的改进机制是利用YOLOv10提出的SCDown魔改YOLOv5进行下采样，其是更高效的下采样。具体而言，其首先利用点卷积调整通道维度，然后利用深度卷积进行空间下采样。这将计算成本减少到和参数数量减少到。同时，这最大限度地保留了下采样过程中的信息，从而在减少延迟的同时实现竞争性性能。本文附网络结构图，完整修改方案以及多种使用方法！欢迎大家订阅我的专栏一起学习YOLO！YOLOv5改进专栏——持续复现各种顶会内容——内含100+创新目录一、本文介绍二、SCDown介绍。

参与评论您还未登录，请先登录后发表或查看评论

YOLOv8改进-添加YOLOv10的SCDown模块

mylunar的博客

07-25

1432

YOLOv8改进-添加YOLOv10的SCDown模块

【YOLOv8改进[Conv]】使用YOLOv10的空间通道解耦下采样SCDown模块替换部分CONv实践助力V8更优秀 + 含全部代码和修改内容 + 首发

静谧、淡雅

05-31

1033

使用YOLOv10的空间通道解耦下采样SCDown模块替换部分CONv实践助力V8更优秀 + 含全部代码和修改内容 + 首发 + 遥遥领先

YOLOv10

m0_61356167的博客

09-11

563

与v8中的卷积不同，v8使用一个标准卷积同时实现空间下采样 h , w → h / 2 , w / 2 ，h,w→ h/2, w/2h,w→h/2,w/2 和通道变化 c → 2c ，计算成本高。SCDown（Spatial-channel decoupled downsampling）将上面两个操作——空间和通道解耦。先通过 1 × 1 的逐点卷积调节通道数，再通过 3 × 3 的深度卷积做空间下采样，在降低计算成本的同时最大限度保留信息。

YOLOv8改进有效系列目录 | 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制

热门推荐

Snu77的博客

12-30

15万+

Hello，各位读者们好，本专栏自开设两个月以来已经更新改进教程120+余篇其中包含C2f、主干、检测头、注意力机制、Neck多种结构上创新，也有损失函数和一些细节点上的创新，订阅本专栏以后你不仅可以收获跟专栏的阅读权限，同时可以进Qq群，里面包含集成我所有创新的YOLO最新目录，和我本人录制的视频讲解教程，如果你想要在YOLOv8系列收获一篇论文，我相信订阅本专栏后你一定会有所收获~YOLOv8改进有效系列目录。

YOLOv10改进 | 细节涨点篇 | DySample一种轻量的动态上采样算子（效果完爆CARAFE）

Snu77的博客

07-16

6163

本文给大家带来的改进机制是一种号称超轻量级且有效的动态上采样器——DySample。与传统的基于内核的动态上采样器相比，DySample采用了一种基于点采样的方法，相比于以前的基于内核的动态上采样器，DySample具有更少的参数、浮点运算次数、GPU内存和延迟。此外，DySample在包括语义分割、目标检测、实例分割、全景分割和单目深度估计在内的五个预测任务中，性能均优于其他上采样器（截至目前最有效的上采样算子），

YOLOv9改进策略目录 | 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制

Snu77的博客

05-13

1万+

Hello，各位读者们好本专栏自开设两个月以来已经更新改进教程50余篇其中包含RepNCSPELAN4、主干、检测头、注意力机制、Neck多种结构上创新，也有损失函数和一些细节点上的创新。同时本人一些讲解视频和包含我所有创新的YOLOv9文档并不能在优快云上传(所有的创新点都经过我的测试是可用的，得到该文件之后大家可以随意组合使用)，所以会建立群的形式在内上传我的文件和视频我也会在群内不定期和大家交流回答大家问题，同时定期会更新一些文章的创新点(经过我融合测试后的，先到先得)。

YOLOv10改进 | 融合篇，YOLOv10改进主干网络为GhostNetV3+MLCA注意机制

在职AI算法工程师，擅长计算机视觉，YOLO目标检测、分割等，擅长web、pyqt界面可视化，好内容持续更新中，来这里跟大家一起学习，共同进步

10-06

536

GhostNetV3 引入了多分支重参数化机制，通过在卷积层中添加额外的平行分支来改善性能。这些分支在训练过程中提供更多的表征能力，最终通过将多个分支重组为一个卷积层来实现推理时的高效性。通过添加配备 BatchNorm 层的重复分支将再参数化引入紧凑型模型。因此作为YOLOv10的主干网络，在此基础上，融入一种轻量级的混合局部通道注意力（MLCA）模块，以提高目标检测网络的性能。该模块能够同时结合通道信息和空间信息，以及局部信息和全局信息，从而提升网络的表示效果。

YOLOv9改进策略 | Conv篇 | 利用YOLOv10提出的SCDown魔改YOLOv9进行下采样（附代码 + 结构图 + 添加教程）

Snu77的博客

06-03

1776

yolov10代码阅读

qq_41131535的博客

06-04

1687

a. 对于SCDown，是 Spatial-channel decoupled downsampling，主要是针对原始的下采样Conv2d（C，2C，kernel=3，stride=2）的下采集，进行修改成 Conv2d（C，2C，kernel=1，stride=1）加上一个组卷积 Conv2d（2C，2C，kernel=3，stride=2，group=2C）；的卷积都替换成了组卷积（depthwise convolution），对于小模型会采用。b. CIB是放在C2f模块中，主要是针对。

【YOLOv9改进[Conv]】使用YOLOv10的空间通道解耦下采样SCDown模块替换部分CONv的实践 + 含全部代码和详细修改内容

静谧、淡雅

06-04

1025

使用YOLOv10的空间通道解耦下采样SCDown模块替换部分CONv的实践 + 含全部代码和详细修改内容，改进YOLOv9

Deformable DETR改进|爆改模型|涨点|在骨干网络和可变形编码器间加入YOLOv10的PSA和SCDown模块（附代码+修改教程）

m0_51665349的博客

10-08

1658

本文修改的模型是Deformable-DETR，在骨干网络和可变形编码器之间加入YOLOv10的PSA和SCDown模块。其中PSA是YOLOv10提出的一种高效的自注意力模块，为了避免注意力带来的巨额开销，本文将PSA应用于可变形编码器输入的最高层级特征图。SCConv是一种空间和通道解耦的卷积模块，本文将其应用于骨干网络输出的特征图的特征融合，提升模型的多尺度能力。

YOLOv10（2）：网络结构及其检测模型代码部分阅读

tecsai的博客

05-31

8478

YOLOv10的代码结构和YOLOv8很相似，说是基于YOLOv8魔改的也不为过。话说回来，也算是魔改的非常成功的了。从代码工程上看，也是通过类一层层继承，获得一个完整的模型网络。

YOLOv10 | 教你利用yolov10训练自己数据集（含环境搭建、参数解析、数据集查找、模型训练、推理、导出）

最新发布

m0_58941767的博客

01-20

1188

YOLO通常利用带有步幅2的常规3×3标准卷积，同时实现空间下采样（从H×W到H/2×W/2）和通道变换（从C到2C）。这引入了不可忽视的计算成本和参数数量相反，我们提出分离空间减少和通道增加操作，进行更高效的下采样。具体而言，我们首先利用点卷积调整通道维度，然后利用深度卷积进行空间下采样。这将计算成本减少到和参数数量减少到。同时，这最大限度地保留了下采样过程中的信息，从而在减少延迟的同时实现竞争性性能。YOLO通常为所有阶段使用相同的基本构建块，例如YOLOv8中的瓶颈块。

YOLOv10原理与实战训练自己的数据集

06-12

YOLOv10是最近提出的YOLO的改进版本。在后处理方面，提出了一致性双重分配策略用于无NMS训练，从而实现了高效的端到端检测。在模型架构方面，引入了全面的效率-准确性驱动模型设计策略，改善了性能-效率权衡。本课程讲解YOLOv10的论文、网络架构等原理并解析关键代码，并进行训练自己数据集的项目实战。本课程将手把手地教大家使用labelImg标注和使用YOLOv10训练自己的数据集，完成一个多目标检测实战项目，可检测图像和视频中的足球和梅西两个目标类别。本课程分别在Windows、Ubuntu和阿里云免费GPU算力平台上做手把手的项目操作演示。GPU免费算力的领取方式和阿里云平台上的项目实战操作流程可见课程视频。课程项目内容包括：安装软件环境（Nvidia显卡驱动、cuda和cudnn）、安装PyTorch、安装YOLOv10、使用labelImg标注自己的数据集、准备自己的数据集（自动划分训练集和验证集）、修改配置文件、训练自己的数据集、测试训练出的网络模型和性能统计。课程还提供PySide6开发的YOLOv10的可视化界面代码并进行了操作演示。

学习经验分享【37】YOLOv10解读——最新YOLO版本

m0_70388905的博客

05-25

1万+

YOLOv10解读——最新YOLO版本

YOLOv10 | 手把手教你利用yolov10训练自己数据集（含环境搭建、参数解析、数据集查找、模型训练、推理、导出）

Snu77的博客

05-26

3万+

本文内含YOLOv10网络结构图 + 各个创新模块手撕结构图 + 训练教程 + 推理教程 + 参数解析 + 环境搭建 + 数据集获取等一些有关YOLOv10的内容！目录一、前言二、整体网络结构图三、空间-通道分离下采样3.1 SCDown介绍3.2 C2fUIB介绍3.3 PSA介绍四、环境搭建五、数据集获取六、模型获取七、模型训练7.1 训练的三种方式7.1.1 方式一7.1.2 方式二（推荐）7.1.3 方式三八、模型验证/测试九、模型推理十、模型输出官方论文地址点击此处即可跳转。

YOLOv10训练中遇到的Error总结：

2303_76526269的博客

10-06

749

github回答 https://github.com/ultralytics/ultralytics/issues/13821。F:\anaconda3\envs\yolov10\Lib\site-packages\torch\lib 已删除。本人运行pip install --upgrade ultralytics之后貌似没遇到过。yolov10为训练所用的虚拟环境。anaconda目录中文件重复。命令行运行，以下命令遇到的。## 训练中的Err。

yolov8下采样模块改进

12-28

### YOLOv8 下采样模块改进方法 #### 使用YOLOv9下采样机制增强感受野为了提升YOLOv8的目标分割性能，可以采用YOLOv9的下采样机制。这种改进能够显著扩大模型的感受野，从而更好地捕捉图像中的细节信息[^1]。 ```python def yolov9_downsample(input_tensor, filters): x = tf.keras.layers.Conv2D(filters=filters, kernel_size=3, strides=(2, 2), padding='same')(input_tensor) x = tf.keras.layers.BatchNormalization()(x) output = tf.keras.layers.LeakyReLU(alpha=0.1)(x) return output ``` #### 应用Context Guided Block (CG block) 另一种有效的改进方式是引入Context Guided Block (CG block)，该模块源自CGNet论文，旨在模仿人类视觉系统的特性——即通过结合局部特征、周边环境及整体场景的信息来增强识别精度。具体实现时需调整原有的卷积层配置[^2]。 ```python class ContextGuidedBlock(tf.keras.Model): def __init__(self, channels): super(ContextGuidedBlock, self).__init__() # 定义局部分支 self.local_branch = tf.keras.Sequential([ tf.keras.layers.Conv2D(channels//4, 3, 1, 'same'), tf.keras.layers.BatchNorm(), tf.keras.layers.ReLU() ]) # 定义上下文分支 self.context_branch = tf.keras.Sequential([ tf.keras.layers.AvgPool2D(pool_size=(3, 3), strides=1, padding='same'), tf.keras.layers.Conv2D(channels//4, 1, 1), tf.keras.layers.BatchNorm(), tf.keras.layers.ReLU() ]) def call(self, inputs): local_features = self.local_branch(inputs) context_features = self.context_branch(inputs) fused_feature = tf.concat([local_features, context_features], axis=-1) return fused_feature ``` #### 利用空间通道解耦下采样(SCDown)技术来自YOLOv10的空间通道解耦下采样方案同样适用于优化YOLOv8架构下的下采样过程。此方法通过对输入张量执行特定操作，在保持计算效率的同时提高了表达能力[^3]。 ```python def scdown_module(x_in, out_channels): branch_1 = tf.keras.layers.DepthwiseConv2D(kernel_size=3, strides=2, padding="same")(x_in) branch_1 = tf.keras.layers.Conv2D(out_channels // 2, kernel_size=1, strides=1, padding="valid")(branch_1) branch_2 = tf.keras.layers.MaxPooling2D((2, 2))(x_in) branch_2 = tf.keras.layers.Conv2D(out_channels // 2, kernel_size=1, strides=1, padding="valid")(branch_2) concat = tf.keras.layers.Concatenate()([branch_1, branch_2]) result = tf.keras.layers.Conv2D(out_channels, kernel_size=1, strides=1, padding="valid")(concat) return result ```

爆改YOLOv8|利用yolov10的SCDown改进yolov8-下采样

1, 本文介绍

2， 将SCDown 融合进yolov8

2，将SCDown 融合进yolov8