【论文阅读】【三维目标检测】Stereo R-CNN based 3D Object Detection for Autonomous Driving

本文介绍了Stereo R-CNN在自动驾驶3D目标检测中的创新方法,利用立体相机进行检测。Stereo RPN通过结合左右图像生成提案,接着通过RoI Align Pooling和多任务预测头确定物体类别、3D边界框、尺寸和视角。3D Box Estimation和Dense 3D Box Alignment进一步优化深度信息,提高检测精度。实验表明Stereo RPN、关键点检测和密集对齐的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Stereo R-CNN based 3D Object Detection for Autonomous Driving
使用stereo camera 完成 3D Object Detection

Stereo R-CNN

该方法主要使用几何学的的约束来进行检测,不同于传统的two stage的方法。整个网络结构如下:
在这里插入图片描述

Stereo RPN

Stereo RPN目的是为了提取左右两幅图的proposal。其target的处理方式为:将左右两幅图的同一个物体的box取并集,形成一个新的box,用这个box与anchor的IoU来对anchor的label进行分类;对于是前景的anchor,计算要回归的label,由于是预测两幅图中的box,所以要回归的值为两幅图中anchor与真值的横坐标的位置偏差和尺度偏差,和两幅图共用的纵坐标的位置偏差和尺度偏差,纵坐标之所以能共用,是因为安装在车上的双目相机的基线是水平的,所以纵坐标的位置偏差和尺度偏差应该是一样的。
然后分别对左右图进行NMS,左右两幅图都会保留一些proposal,然后选取左右两幅图都保留的proposal的那些进行训练。

Stereo R-CNN

得到了上述的proposal,然后去左相机的proposal进行RoI Align Pooling,每个proposal得到对应的14*14的feature map。

使用这个feature map作为输入,通过4个头分别预测,proposal的object class, stereo bounding boxes, dimension, 和viewpoint angle。其中,dimensions是指3D bo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值