一、本文介绍
本文给大家带来的改进机制是实现级联群体注意力机制CascadedGroupAttention,其主要思想为增强输入到注意力头的特征的多样性。与以前的自注意力不同,它为每个头提供不同的输入分割,并跨头级联输出特征。这种方法不仅减少了多头注意力中的计算冗余,而且通过增加网络深度来提升模型容量,亲测在我的25个类别的数据上,大部分的类别均有一定的涨点效果,仅有部分的类别保持不变,同时给该注意力机制含有二次创新的机会
欢迎大家订阅我的专栏一起学习YOLO!

目录
二、 CascadedGroupAttention的基本原理
二、 CascadedGroupAttention的基本原理

官方论文地址: 官方论文地址点击即可跳转
官方代码地址: 官方代码地址点击即可跳转
本文详细介绍了YOLOv8中引入的级联群体注意力机制CascadedGroupAttention(CGA),该机制通过增强输入到注意力头的特征多样性,减少计算冗余并提升模型容量。CGA的核心在于将输入特征分割,每个部分输入到一个注意力头,级联输出以提高注意力的多样性和计算效率。文章还提供了CGA的添加方式、yaml配置文件及训练过程记录。
订阅专栏 解锁全文
788





