自动驾驶鸟瞰视图感知技术解析
1. LiDAR 基 BEV 感知方法
LiDAR 基 BEV 感知存在不同的技术路线,其中一种是在体素上直接进行特征提取,另一种是先将 LiDAR 点云转换到 BEV 空间再进行 2D 特征提取。
- 直接在体素上进行特征提取
- CenterPoint :在众多体素上执行特定机制。
- SST :借鉴 Swin Transformer 中移动窗口的思想,将体素化的点云空间划分为窗口,应用稀疏区域注意力和窗口移动来避免下采样导致的信息损失。
- AFDetV2 :引入关键点监督作为辅助任务,并采用多任务头构建单阶段无锚网络。
- 先转换到 BEV 空间再进行 2D 特征提取(Post - BEV 方法)
- MV3D :先将 LiDAR 点云转换到 BEV 空间,在 BEV 空间生成 3D 物体提议,再将其投影回三个视图。对每个视图使用 ROI 池化提取区域特征,通过深度融合网络融合这些特征,最后联合预测 3D 边界框和物体类别。
- PointPillars :“pillar” 是一种高度无限的独特体素,该方法利用 PointNet 的精简版本学习柱子中点的表示,然后应用标准 2D 卷积网络和检测头处理编码后的特征。虽然其性能不如一些先进方法,但效率高,适合工业应用。
下面用 mermaid 流程图展示 MV3D 的工作流程:
自动驾驶BEV感知技术解析
超级会员免费看
订阅专栏 解锁全文
65

被折叠的 条评论
为什么被折叠?



