目标检测数据集格式/bounding box坐标表示

本文详细比较了PascalVOC、COCO和YOLO三种对象检测框架中边界框的坐标表示方式,包括x_min、y_min、x_max、y_max(VOC)、x_min、y_min、width、height(COCO)以及x_center、y_center、width、height(YOLO),重点介绍了YOLO中数据规范化的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写在前面的废话:为什么横向是x,纵向是y?(好像跟高中数学里的那种坐标系的旋转不一样?)
意外收获:
在这里插入图片描述

正文

在这里插入图片描述

pascal_voc

[x_min, y_min, x_max, y_max]
x_min和y_min表示边框左上角坐标,x_max和y_max表示边框的右下脚坐标。
上图例子就是[98, 345, 420, 462]。

coco

[x_min, y_min, width, height]
表示左上角的坐标以及边框的宽度和高度。
上图例子就是[98, 345, 322, 117]。

yolo

[x_center, y_center, width, height]
这4个值是经过数据规范化(normalized )的。
x_center, y_center表示边框的中心位置, width, height分别表示边框的宽度和高度
边框的宽度是322,高度是117。
不规范化是[(98 + (322 / 2)), (345 + (117 / 2)), 322, 117]
= [259, 403.5, 322, 117]
规范化方法是
[259 / 640, 403.5 / 480, 322 / 640, 117 / 480]
最终结果是
[0.4046875, 0.840625, 0.503125, 0.24375]。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值