YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
前言
- 记录在YOLOv5添加注意力机制,方便自己查阅。
- 由于本人水平有限,难免出现错漏,敬请批评改正。
- 更多精彩内容,可点击进入YOLO系列专栏或我的个人主页查看
- YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
https://blog.youkuaiyun.com/FriendshipTang/article/details/129969044- YOLOv7训练自己的数据集(口罩检测)
https://blog.youkuaiyun.com/FriendshipTang/article/details/126513426- YOLOv8训练自己的数据集(足球检测)
https://blog.youkuaiyun.com/FriendshipTang/article/details/129035180
前提条件
- 熟悉Python
相关介绍
- Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
- PyTorch 是一个深度学习框架,封装好了很多网络和深度学习相关的工具方便我们调用,而不用我们一个个去单独写了。它分为 CPU 和 GPU 版本,其他框架还有 TensorFlow、Caffe 等。PyTorch 是由 Facebook 人工智能研究院(FAIR)基于 Torch 推出的,它是一个基于 Python 的可续计算包,提供两个高级功能:1、具有强大的 GPU 加速的张量计算(如 NumPy);2、构建深度神经网络时的自动微分机制。
- YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。它是一个在COCO数据集上预训练的物体检测架构和模型系列,代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。
- 注意力机制是一种通过网络自主学习出的一组权重系数,并以“动态加权”的方式来强调我们所感兴趣的区域同时抑制不相关背景区域的机制。在计算机视觉领域中,注意力机制可以大致分为两大类:强注意力和软注意力。强注意力是指在给定的输入下,只有一个区域被强调,其他区域

本文介绍了如何将四种不同的注意力机制——SE、CBAM、CoordAtt和ECA——添加到YOLOv5目标检测模型中,包括每种机制的原理和优缺点,并提供了相应的代码资源链接。
最低0.47元/天 解锁文章
287





