3D目标检测数据集及评价指标

1. KITTI

一个前视双目数据集,附有雷达数据,主要用于单目3D目标检测模型。数据集根据遮挡将目标分为三档,分别是未遮挡Easy,半遮挡Mod.,和大部分遮挡Hard,一般模型检测指标都是根据这三类标签分别计算mAP。

mAP计算流程:

①根据一张图片中某一类的预测框的置信度由大到小进行排序;

②对每个预测框和GT计算IOU,只有大于阈值的会保留,如果GT对应多个预测框,只取IOU最大的那个,其余的作为FP,最后每个GT最多只对应一个预测框作为TP;

③计算召回率和精准率,Recall=TP/GT的个数(固定),Precision=TP/TP+FP,根据置信度从大到小进行计算,所以是分子分母都会变化,而Recall分母不变,因而会保持不变或变大。

④绘制PR曲线,横坐标为Recall,纵坐标为Precision,曲线的面积为ap;

⑤对一张图片中不同的分类分别计算求平均得到mAP。

2. Nusence数据集

有六个环视摄像头和激光雷达,多用于环视3D目标检测。评价指标有:mAP、mATE、mASE、mAOE、mAVE、mAAE、NDS。

mAP:

在评测时依旧使用检测领域的AP,不过AP的阈值匹配不使用IoU来计算,而使用在地平面上的2D中心距离d来计算。这样解耦了物体的尺寸和方向对AP计算的影响。d设置为D={0.5,1,2,4}米,也就是说,将原来的IOU阈值改为平面d的阈值,只有小于d的才作为AP进行计算,在计算AP时,去除了低于0.1

### 创建用于3D目标检测数据集 #### 数据收集 为了构建高质量的3D目标检测数据集,需采集来自不同环境条件下的传感器数据。通常情况下,会利用激光雷达(LiDAR)获取点云数据,配合摄像头捕捉RGB图像来增强特征表达能力[^1]。 #### 标注工具 对于3D对象标注工作而言,存在多种专用软件可供选择: - **LabelBox** 支持2D边界框、3D立方体等多种形式的目标标记; - **Spline AI Tools** 提供了直观易用界面来进行复杂形状建模与编辑操作; - **Voxel51's FiftyOne** 不仅可以完成基本的对象分类任务,还能够处理更高级别的场景理解需求; 以上提到的应用程序均具备良好的用户体验设计,并且支持团队协作模式下高效开展大规模项目作业[^2]。 #### 文件格式要求 在保存经过人工校验后的成果时,应遵循特定行业标准或竞赛规定所推荐的形式: - LiDAR点云文件一般采用`.pcd` 或 `.bin` 扩展名存储原始测量值; - RGB图片则沿用常见的JPEG/PNG编码方式; - XML/JSON文档记录着每帧对应的标签信息,其中包含但不限于位置坐标(x,y,z),尺寸(w,h,l)以及旋转角度(yaw,pitch,roll)[^3]。 #### 常见挑战 在整个过程中可能会遇到如下难题: - 获取足够多样化的样本以覆盖各种天气状况和光照变化情况; - 确保多源异构传感设备之间的时间同步精度达到微秒级别; - 设计合理的评价指标体系用来衡量算法性能优劣程度并促进技术迭代进步。 ```python import json def save_labels_to_json(labels, filename='annotations.json'): with open(filename, 'w') as f: json.dump(labels, f) labels_example = { "objects": [ {"class": "car", "position": [1.0, 2.0, 3.0], "dimensions":[4.8, 1.9, 1.7]}, {"class": "pedestrian", "position":[-1.5,-2.5,0],"dimensions":[0.6,0.8,1.7]} ] } save_labels_to_json(labels_example) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值