写在前面的废话:为什么横向是x,纵向是y?(好像跟高中数学里的那种坐标系的旋转不一样?)
意外收获:
正文
pascal_voc
[x_min, y_min, x_max, y_max]
x_min和y_min表示边框左上角坐标,x_max和y_max表示边框的右下脚坐标。
上图例子就是[98, 345, 420, 462]。
coco
[x_min, y_min, width, height]
表示左上角的坐标以及边框的宽度和高度。
上图例子就是[98, 345, 322, 117]。
yolo
[x_center, y_center, width, height]
这4个值是经过数据规范化(normalized )的。
x_center, y_center表示边框的中心位置, width, height分别表示边框的宽度和高度
边框的宽度是322,高度是117。
不规范化是[(98 + (322 / 2)), (345 + (117 / 2)), 322, 117]
= [259, 403.5, 322, 117]
规范化方法是
[259 / 640, 403.5 / 480, 322 / 640, 117 / 480]
最终结果是
[0.4046875, 0.840625, 0.503125, 0.24375]。