这篇论文发表在2019CVPR上,旨在解决人工标注有遮挡,不明确信息(如上图所示)带来的目标检测算法性能降低的问题。
论文的主要新颖点:
1.使用KL散度替换smooth L1 loss
2.对soft-NMS的后续处理中采用var voting 的方式,来预测候选框的位置
为什么这样做,论文中指出使用KL散度
(1)可以成功地捕获数据集中的歧义。包围盒回归器在包围盒不明确时损失较小。
(2)学习的方差在后处理过程中是有用的。我们提出了VAR投票,在NMS过程中,使用邻居的位置加权预测的方差来投票候选盒的位置。
(3)学习的概率分布是可解释的。由于它反映了边界框预测的不确定性水平,因此它可能对自动驾驶汽车和机器人等下游应用程序有所帮助
在KL损失的情况下,模型可以在训练过程中自适应地调整每个对象边界的方差,从而帮助学习更多的区分性特征。
网络预测的概率分布服从高斯分布,其中x是真实边界框的位置,