YOLOv8改进 | SPPF篇 | FocalModulation替换SPPF（精度更高的空间金字塔池化）

Snu77

已于 2024-03-18 10:04:07 修改

阅读量1w

点赞数 37

CC 4.0 BY-SA版权

分类专栏： YOLOv8有效涨点专栏文章标签：深度学习人工智能 pytorch YOLO python 计算机视觉目标检测

于 2023-12-05 16:23:00 首次发布

本文链接：https://blog.youkuaiyun.com/java1314777/article/details/134795835

YOLOv8有效涨点专栏专栏收录该内容

180 篇文章 ¥199.90 ¥299.90

订阅专栏

本文探讨了如何用FocalModulation替换YOLOv8中的SPPF，以提高目标检测的精度。FocalModulation是一种新的特征增强方法，利用注意力机制聚焦关键区域，尤其适合处理小目标和复杂背景中的对象。通过实验证明，FocalModulation在不增加计算量和参数的情况下，能提升模型的性能。

一、本文介绍

本文给大家带来的改进是用FocalModulation技术来替换了原有的SPPF（快速空间金字塔池化）模块。FocalModulation是今年新提出的特征增强方法，它利用注意力机制来聚焦于图像中的关键区域，从而提高模型对这些区域的识别能力。与SPPF相比，FocalModulation不仅能够处理不同尺寸的输入图像，还能更精确地识别和定位图像中的对象。这一技术特别适用于处理那些难以检测的小对象或在复杂背景中的对象（更多的检测效果请看第二章）。我进行了简单的实验，这个FocalModulation能够提升一定的精度，其不影响任何的计算量和参数所以还是可以尝试的(改进起来也比较简单)。

(说一下这里为啥给到四颗星，因为这个改进机制无非就是替换SPPF对于我们的模型没有特别大的改动，而且还能够有一定的涨点效果，所以给到四颗星)

推荐指数：⭐⭐⭐⭐

专栏目录：YOLOv8改进有效系列目录 | 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制

专栏回顾：YOLOv8改进系列专栏——本专栏持续复习各种顶会内容——科研必备

一、本文介绍

二、FocalModulation模型原理

2.1 SPP和SPPF回顾

2.2 FocalModulation模型的基本原理

2.2.1 焦点上下文化

2.2.2 门控聚合

2.2.3 逐元素仿射变换

三、FocalModulation的完整代码

四、手把手教你添加FocalModulation

4.1 FocalModulation的添加教程

4.2 FocalModulation的yaml文件

4.3 FocalModulation的训练过程截图

五、本文总结 

二、FocalModulation模型原理

论文地址：官方论文地址

代码地址：官方代码地址

了解本专栏

21 条评论

南桥北梁 2025.03.13
想咨询一下大佬，如果我把FocalModulation模块前置在SPPF模块之前，而不是替换掉SPPF模块，不考虑参数量增加的缺点外，从代码实现的角度这个想法应该也是可以实现的吧

2301_79581948 2024.11.01
出现了这样的问题 ctx_all = ctx_all + ctx * gates[:, l:l + 1] RuntimeError: The size of tensor a (9) must match the size of tensor b (8) at non-singleton dimension 3

Yao Cheng 2024.03.02
您好，能发一下这个模块的原论文吗
- Snu77回复Yao Cheng 2024.03.03
  文章中有链接的啊

敏婷kate 2024.01.07
出现了这样的错误 File "/usr/local/lib/python3.10/dist-packages/ultralytics/nn/tasks.py", line 700, in parse_model m = getattr(torch.nn, m[3:]) if 'nn.' in m else globals()[m] # get module KeyError: 'FocalModulation' 可以怎么解决
- Snu77回复敏婷kate 2024.01.08
  客气，有问题随时问我即可。
- 敏婷kate回复Snu77 2024.01.08
  感谢大佬，就是两个yolov8的问题，已经可以顺利运行了。
- Snu77回复敏婷kate 2024.01.07
  一般这个问题如果修改步骤没有错误，百分之九十就是因为你有两个YOLOv8，一个是本地下载的，一个是通过pip下载到虚拟环境的，你修改的是本地的仓库，但是你通过YOLO命令行运行的是通过pip下载到仓库里的，所以就会找不到你修改的FocalModulation报这个错误。
- Snu77回复敏婷kate 2024.01.07
  没别的意思我确定一下，然后判断一下是不是我猜测的问题。
- Snu77回复敏婷kate 2024.01.07
  你应该是第一次进行修改模型是把？

Man1999 2023.12.12
想问下大佬在task.py添加按照有参数的注意力机制，具体的参数是什么呢 elif m in {BiAttention,FocalModulation}: args = [ch[f],*args] 可以吗
- Man1999回复Snu77 2023.12.12
  明白还想问下大佬用的是yolov8n是吗
- Snu77回复Man1999 2023.12.12
  针对我这个是可以的
- Snu77回复Man1999 2023.12.12
  部分可以但是需要看你的参数，这个只是传参数进去，

YeFeng95773 2023.12.10
感谢大佬，看论文没看懂，官方给的源码里一些小细节大佬也改成可以直接拿来用的了，看明白了，很贴心
- Snu77回复YeFeng95773 2023.12.10
  感谢支持[face]emoji:065.png[/face]
- YeFeng95773回复YeFeng95773 2023.12.10
  就是博客里的代码地址好像还是上一篇的大核注意力哈哈哈

勤劳勇敢好榜样 2023.12.06
复现成功跟随博主脚步[face]emoji:064.png[/face]
- m0_74404567回复勤劳勇敢好榜样 2024.08.28
  想问一下你改进了之后涨点了多少
- 看都看不懂嘛回复勤劳勇敢好榜样 2024.04.07
  能咨询一下吗，我cat出了点问题
- qq_53022311回复勤劳勇敢好榜样 2024.03.25
  想问一下，这个曲线图这样可以吗？