论文阅读|目标检测之CE-FPN,将通道增强运用到上采样,减少信息丢失,同时添加了通道注意力机制

本文针对FPN在目标检测中的局限性,如信息衰减、混叠效应和通道减少,提出了一种新的CE-FPN方法。CE-FPN包括子像素跳过融合、子像素上下文增强和通道注意力引导模块,有效利用高层通道信息,减轻信息丢失和混叠效应,提升特征金字塔的性能。实验表明,CE-FPN在COCO基准上展现出竞争力。

在这里插入图片描述

论文原文:https://arxiv.org/abs/2103.10643

目前FPN-based的方法大多存在Channel Reduction的固有缺陷,导致语义信息的丢失。而融合后的各种特征图可能会造成严重的混叠效果。本文提出了一种新的通道增强特征金字塔网络(CE-FPN),该网络由3个简单而有效的模块组成。

具体来说,受sub-pixel convolution的启发,提出了一种既实现Channel增强又实现上采样的sub-pixel skip fusion方法。它代替了原来的卷积和线性上采样,减少了由于Channel Reduction而造成的信息丢失。然后,然后本文还提出了一种sub-pixel context enhancement模块来提取更多的特征表示,由于通过Sub-pixel Convolution利用了丰富的通道信息,所以优于其他context方法。此外,引入了一个channel attention guided module(通道注意力引导模块)对每一层的最终集成特征进行优化,从而在较少的计算量下减轻了混叠效应。实验表明,CE-FPN在MS COCO基准上与最先进的FPN-based的检测器相比,具有竞争性的性能。

1. INTRODUCTION

FPN能有效解决物体的尺度变化问题,通过融合底层背景信息和高层语义信息大大提高了检测精度(YOLOF中指出FPN之所以成功除了多尺度特征融合,还有“分而治之”的作用,即不同level检测不同尺度物体,并且认为这个才是其成功关键)。然而,FPN还存在两个普遍认同的局限性:

(1)融合过程中的信息衰减(2)跨尺度融合中的混叠效应

此外,本文还认为**(3)存在Channel Reduction的固有缺陷**。

下面分别介绍这3点。

在这里插入图片描述

Information loss of channel reduction.

图1(a)中FPN-based的方法采用1×1 convolutional layers对backbone的输出特征映射CiC_iCi进行Channel降维,丢失了Channel信息。CiC_iCi通常在高级特征映射中提取数千个通道,这些通道在中被缩减为一个小得多的常数(比如说2048缩减为256)。现有的方法主要是在Channel Redection映射上增加额外的模块,而不是像图1(b)、1©所示的充分利用CiC_iC

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值