鲁棒单目3D检测中的自适应方法
1. 实验验证
1.1 数据集
采用KITTI 3D目标检测基准进行方法评估。该基准共有7481张训练图像和7518张测试图像。由于测试集标签不可用,将训练集划分为训练子集(3712张图像)和验证集(3769张图像)。测试集结果从训练集得出,验证集用于消融研究。
1.2 实验设置
1.2.1 训练细节
- 数据增强:对图像的色调(H)、饱和度(S)、亮度(V)进行随机调整,并随机翻转。
- 图像尺寸:将训练图像调整为384×1280像素。
- 批次大小:8。
- 学习率:采用预热策略,初始值为0.01,预热迭代次数为500,预热比例为0.001。
- 权重衰减:0.0005。
- 训练轮数:100。
- 权重策略:使用移动平均权重,参数值为0.999。
- 可重复性保证:固定随机种子,在所有实验中确定性地重新实现CUDA算子。
1.2.2 推理细节
- 后处理:采用3D非极大值抑制(NMS),阈值为0.7。
- 图像分辨率:测试图像保持384×1280像素。
- 推理时间测量:在RTX 2080Ti GPU上进行,排除图像读取时间,禁用TensorRT加速。
1.2.3 评估指标
采用KITTI数据集的官方评估指标,涵盖汽车、行人和骑自行车的人三个目标类别。考虑三种难度级别(简单、中等、