
0. 前言:
激光雷达作为自动驾驶不可或缺的传感器,随着价格不断下降,各种基于深度学习的模型也层出不穷(坐等马斯克打脸);
激光雷达物体识别的任务:
- 输入: 激光点云(x, y, z, intensity)
- 输出: 3D Boundingbox(BB) 信息: 中心点左边(x, y, z); 3D BB尺寸 length width height, 三个方向的朝向角 yaw pitch roll, 但是考虑到自动驾驶车辆实际是行驶在二维世界,所以真正的输出常是(x, y, l, w, h, yaw)
激光雷达点云的特点:
- 点云无序性
- 相邻点相关性
- 旋转平移不变行
1. 正文
基于深度学习方法的物体识别路线,根据模型输入形式可以大体分为以下三类:
- 纯点云输入
- 将点云转化为体素格子
- 将点云投影到二维栅格图中,这又分为将投影到鸟瞰图(BEV)和前视图
下面基于上面的分类对当前的模型做一个总结:
- 基于纯点的输入:
这个最出名的就是 PointNet 系列了,具体可以参考我专栏对这几篇文章的解读: PointNet系列(1)-PointNet论文解读; PointNet系列(2)-PointNet++论文解读; PointNet系列(3)-Frustum-PointNet论文解读; PointNet 提出了将纯点