KITTI数据集-label解析笔记

原创已于 2023-07-03 10:58:28 修改 · 3.1k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #目标检测

于 2022-11-14 15:04:46 首次发布

本文解析了KITTI数据集中关于对象类别、截断遮挡、2D/3D信息的详细标签结构，并介绍了传感器坐标转换参数。了解这些对于自动驾驶研究至关重要。

笔记摘自：KITTI数据集--label解析与传感器间坐标转换参数解析_苏源流的博客-优快云博客

KITTI数据集是自动驾驶领域最知名的数据集之一。

一、kitti数据集，label解析

16个数代表的含义：

第1个字符串：代表目标的类别

'Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' or 'DontCare'

注意，’DontCare’ 标签表示该区域没有被标注，比如由于目标物体距离激光雷达太远。为了防止在评估过程中（主要是计算precision），将本来是目标物体但是因为某些原因而没有标注的区域统计为假阳性(false positives)，评估脚本会自动忽略’DontCare’ 区域的预测结果。

第2个数：代表目标是否被截断

从0（非截断）到1（截断）浮动，其中truncated指离开图像边界的对象

第3个数：代表目标是否被遮挡

整数0，1，2，3表示被遮挡的程度

0：完全可见 1：小部分遮挡 2：大部分遮挡 3：完全遮挡（unknown）

第4个数：alpha，目标的观察角度，范围：-pi~pi

是在相机坐标系下，以相机原点为中心，相机原点到物体中心的连线为半径，将物体绕相机y轴旋转至相机z轴，此时物体方向与相机x轴的夹角。

alpha = rotation_y - theta

第5～8这4个数：bbox_2d：2d框的对角点像素信息，单位为像素

xmin，ymin，xmax，ymax

第9～11这3个数：size_3d：3d框的尺寸dimension：高、宽、长（h w l单位：米）

第12～14这3个数：center_3d：3d框的中心坐标location： x,y,z（在照相机坐标系下，单位：米）

第15个数：rotation_y：目标的3维空间方向：（见上图）

在照相机坐标系下，物体的全局方向角（物体前进方向与相机坐标系x轴的夹角），范围：-pi~pi

第16个数：检测的置信度confidence

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。