将边界框（Bounding Box）的坐标和尺寸转换为归一化的空间特征_前端生成的矩形框的点的坐标执行归一化-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_44012667/article/details/146873466

定义了一个名为 get_spatial_feat 的函数，其功能是将边界框（Bounding Box）的坐标和尺寸转换为归一化的空间特征，通常用于计算机视觉任务（如目标检测或关系识别）：

函数参数

• bbox: 输入边界框数组，形状为 (N, 4)，其中 N 是边界框数量，每个边界框包含 [x0, y0, x1, y1]（左上角和右下角坐标）。
• img_h: 图像高度。
• img_w: 图像宽度。

功能步骤

初始化特征数组
```
spatial_feat = np.zeros((bbox.shape[0], 5), dtype=np.float)
```
• 创建一个形状为 (N, 5) 的零数组，用于存储每个边界框的5个归一化特征。

归一化坐标

spatial_feat[:, 0] = bbox[:, 0] / float(img_w)  # 左上角x坐标归一化
spatial_feat[:, 1] = bbox[:, 1] / float(img_h)  # 左上角y坐标归一化
spatial_feat[:, 2] = bbox[:, 2] / float(img_w)  # 右下角x坐标归一化
spatial_feat[:, 3] = bbox[:, 3] / float(img_h)  # 右下角y坐标归一化

• 将边界框的绝对坐标转换为相对于图像尺寸的比例（范围 [0, 1]），使特征与图像尺寸无关。

计算归一化面积
```
spatial_feat[:, 4] = (bbox[:, 2] - bbox[:, 0]) * (bbox[:, 3] - bbox[:, 1]) / float(img_h * img_w)
```
• 计算边界框的面积（宽度 x1-x0 × 高度 y1-y0），并除以图像总面积，得到面积占比（范围 [0, 1]）。