1. EVCBlock介绍
1.1 摘要:摘要:视觉特征金字塔在广泛的应用中显示了其有效性和效率的优越性。 然而,现有的方法过分关注层间特征交互,而忽略了层内特征调节,而这被经验证明是有益的。 尽管一些方法尝试借助注意力机制或视觉变换器来学习紧凑的层内特征表示,但它们忽略了对于密集预测任务很重要的被忽略的角区域。 为了解决这个问题,在本文中,我们提出了一种用于目标检测的集中式特征金字塔(CFP),它基于全局显式集中式特征调节。 具体来说,我们首先提出了一种空间显式视觉中心方案,其中使用轻量级 MLP 来捕获全局长程依赖性,并使用并行可学习视觉中心机制来捕获输入图像的局部角区域。 在此基础上,我们以自上而下的方式提出了对常用特征金字塔的全局集中调节,其中从最深的层内特征获得的显式视觉中心信息用于调节额部浅层特征。 与现有的特征金字塔相比,CFP不仅能够捕获全局长程依赖关系,而且能够有效地获得全面且具有区分性的特征表示。 在具有挑战性的 MS-COCO 上的实验结果验证了我们提出的 CFP 可以在最先进的 YOLOv5 和 YOLOX 目标检测基线上实现一致的性能增益。
官方论文地址: