本文首发于公众号【DeepDriving】,欢迎关注。
0. 前言
最近几年,BEV
感知是自动驾驶领域中一个非常热门研究方向,其核心思想是把多路传感器的数据转换到统一的BEV
空间中去提取特征,实现目标检测、地图构建等任务。如何把多路相机的数据从二维的图像视角转换到三维的BEV
视角?LSS
提出一种显示估计深度信息的方法,实现图像特征到BEV
特征的转换,从而实现语义分割任务。
LSS
是英伟达在ECCV2020
上发表的文章《Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D
》中提出的一个BEV
感知算法,后续很多BEV
感知算法如CaDDN
、BEVDet
都是在LSS
的基础上实现的。本文将结合论文和代码详细解读LSS
的原理。
1. 核心思想
作者提出一种新的端到端架构,该架构可以从任意数量的相机中直接提取给定图像数据场景中的鸟瞰图(<