目标检测：Generalized Focal Loss V2（CVPR2020）

原创已于 2022-08-25 16:32:13 修改 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #深度学习 #人工智能

于 2022-08-25 16:28:55 首次发布

目标检测同时被 2 个专栏收录

11 篇文章

订阅专栏

paper

7 篇文章

订阅专栏

GFLv2提出了一种新的回归质量评估方法，通过分析离散概率分布的平滑度来衡量边界框的可靠性。该方法可以提高非极大抑制（NMS）阶段的选择准确性。

Generalized Focal Loss V2: Learning Reliable Localization Quality Estimation for Dense Object Detection
CCF-A
Xiang LiWenhai WangXiaolin HuJun LiJinhui TangJian Yang
computer vision and pattern recognition arXiv: Computer Vision and Pattern Recognition Nov 2020

基于GFL v1

很显然，这篇文章书接上回
作者在v1中提出了GFL（包含优化带分类任务的QFL和优化回归任务的DFL），其回归任务是基于离散概率分布估计做的，很是巧妙。在v2中，作者基于v1中回归任务的离散概率分布估计，对回归任务进行质量评估，以帮助NMS时保留到回归质量最好的边界框。其直观的原理是这样的：估计的离散概率分布越平滑，那不确定性越高，网络对得到的框的质量是表示怀疑的，概率分布越尖锐，表示确定性很高，网络很笃定回归得到的边界框。

GFL v2的具体实现

作者在文中说，在NMS是所用的排位分数J可以按下式分解：
J = C × I
C代表分类分数向量，I代表回归质量，是一个标量（估计的当前预测框与gt框的IoU），这样J就是分类与回归质量的联合表征。

我们直接看它怎么具体实现的，首先上网络检测头的结构图：
在这里插入图片描述
回归分支得到了4个离散概率分布P，在每一个p中，取最高的k个概率值（Top-k），以及这k个概率值的均值，
得到H×W×4×(k+1)特征，文中k取4，那么就得到了H×W×20大小的特征F，然后按照FC，ReLU，FC，Sigmoid的顺序进行特征提取，中间隐藏层的通道数设置为了64，最终得到一个标量I，与分类向量C进行相乘，得到具有回归质量感知的分类结果J。
在这里插入图片描述
如上图，使用均值对P分布的相对偏移不敏感，其实也可以使用方差等，但效果没均值好。