边框回归：BoundingBox-Regression(BBR)

最新推荐文章于 2024-10-03 18:52:21 发布

原创

最新推荐文章于 2024-10-03 18:52:21 发布 · 8.2k 阅读

·

21

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#BoundingBoxRegression #BBR #边框回归 #RCNN

本文介绍了BoundingBox Regression (BBR)在RCNN中的应用，解释了BBR的主要目的是解决mislocalization问题，通过线性回归提高mAp。内容详细解析了BBR的输入不是所有IoU小于0.6的框，而是选取IoU大于0.6的框进行回归。同时，讨论了为何在IoU较大的情况下，变换可以视为线性变化，并且说明了使用exp形式表示缩放尺寸的原因。最后，阐述了损失函数和输入特征的选择，强调BBR是针对每种类别训练的，而非独立于分类信息。

为什么要做BoundingBox Regression（BBR）?

首先我们先来考虑，RCNN中为什么要做BoundingBox-Regression?

Bounding Boxregression是 RCNN中使用的边框回归方法，在RCNN的论文中，作者指出：主要的错误是源于mislocalization。为了解决这个问题，作者使用了bounding box regression。
这个方法使得mAp提高了3到4个点。
这里写图片描述

BBR的输入是什么？

注意，这里网上很多地方都说的不太正确，有误导，我仔细理解了一些论文，把自己的理解写下。（羞涩）
这里写图片描述

对于预测框P,我们有一个ground truth是G：当0.1< IoU < 0.5时出现重复，这种情况属于作者说的poor localiazation, 但注意：我们使用的并不是这样的框进行BBR(网上很多地方都在这里出现了误导),作者是用iou>0.6的进行BBR,也就是iou<0.6的Bounding Box会直接被舍弃，不进行BBR。这样做是为了满足线性转换的条件。否则会导致训练的回归模型不 work.

（当 P跟 G 离得较远，就是复杂的非线性问题了，此时用线性回归建模显然不合理。)

至于为什么当IoU较大的时候，我们才认为是线性变化，我找到一个觉得解释的比较清楚的，截图在下面：

最低0.47元/天解锁文章

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。