YOLOv8凭借高效的C2f模块和Anchor-Free检测头,在精度与速度间取得了出色平衡,但在边缘设备(如Jetson Nano、RK3588)实时部署场景中,前向传播过程中仍存在激活函数冗余问题:原生C2f模块中密集堆叠的SiLU激活函数,虽能引入非线性特征表达,但部分位置的激活函数对特征增益贡献极小,反而占用大量计算资源(约占Backbone计算量的18%),成为推理速度的瓶颈。
本文提出YOLOv8-FastAct优化方案:通过分析C2f模块的特征传播规律,“选择性移除”冗余SiLU激活函数——保留深层语义特征层的激活,移除浅层低语义层的冗余激活,在参数量几乎不变(变化≤1%)的前提下,使YOLOv8n/s的推理速度提升12%15%,mAP@0.5:0.95仅下降0.2%0.4%,完美适配边缘设备“高精度+低延迟”的部署需求,且工程化修改成本极低(仅需调整C2f模块的激活函数分布)。
一、核心痛点:YOLOv8激活函数的冗余本质
1. 原生YOLOv8 Backbone激活函数分布
YOLOv8的Backbone由“Focus → C2f×3 → SPPF”组成,核心特征提取依赖C2f模块。原生C2f模块的结构为:
输入 → 分流卷积(1×1) → 路1(直接输出) → 路2(串联n个Bottleneck:Conv→BN→SiLU) → 拼接 → 1×1卷积融合 → SiLU → 输出
其中激活
订阅专栏 解锁全文
600

被折叠的 条评论
为什么被折叠?



