【目标检测】Bounding Box Regression

最新推荐文章于 2025-07-13 21:04:15 发布

原创最新推荐文章于 2025-07-13 21:04:15 发布 · 1w 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #深度学习

机器学习专栏收录该内容

22 篇文章

订阅专栏

本文深入解析BoundingBox回归在目标检测中的作用及其实现方法。详细介绍了从候选区域到精确边界框的调整过程，以及如何通过线性变换实现边界框的微调。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Bounding Box是目标检测中一个重要概念。常见格式是边界框左上角坐标、右下角坐标，即[xmin,ymin,xmax,ymax]；或者边界框中心坐标，宽高，即[x_center,y_center,w,h]。

Bounding Box Regression的作用

以下图为例，红色框表示Ground Truth, 蓝色框为网络输出的候选区域框Region Proposal。蓝色框被分类器识别为person，但因框定位不准(IoU<阈值)，则也是检测失败。 Bounding Box Regression的目的就是对蓝色框微调，使得经过微调后的窗口跟真实边界框更接近[1]。

如何进行Bounding Box Regression

以四维向量(x,y,w,h) 表示的Bounding Box为例，即窗口的中心点坐标[x,y]和宽高[w,h]。P= $[P_x,P_y,P_w,P_h]$ 表示原始的Region Proposal, G= $[G_x,G_y,G_w,G_h]$ 表示Ground Truth，Bounding Box Regression的目标是寻找一种函数关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口G更接近的回归窗口 $\hat{G} = [\hat{G}_x,\hat{G}_y,\hat{G}_w,\hat{G}_h]$ 。[2]