【论文笔记】基于点云投影的激光里程计: CNN for IMU Assisted Odometry Estimation using Velodyne LiDAR

最新推荐文章于 2024-09-20 07:30:21 发布

原创最新推荐文章于 2024-09-20 07:30:21 发布 · 600 阅读

2 ·

CC 4.0 BY-SA版权

点云处理同时被 2 个专栏收录

21 篇文章

订阅专栏

激光里程计

15 篇文章

订阅专栏

本文介绍了一种将三维点云数据编码为二维矩阵的方法，并利用卷积神经网络(CNN)进行特征提取及处理。该方法应用于激光里程计中，通过多帧输入提升鲁棒性并采用孪生神经网络预测旋转和平移。此外，通过分类问题的转换进一步提升了旋转量预测精度。

论文将三维点云编码成2维矩阵,使用CNN对其进行特征提取和后续处理.
类似的方法在其之前的工作中被用于ground segmentation 以及 vehicle detection：

《M. Velas, M. Spanel, M. Hradis, and A. Herout, “CNN for very fastground segmentation in Velodyne lidar data,” 2017. [Online]. Available:http://arxiv.org/abs/1709.0212》，

《B. Li, T. Zhang, and T. Xia, “Vehicle detection from 3D lidarusing fully convolutional network,”CoRR, vol. abs/1608.07916, 2016.[Online]. Available: http://arxiv.org/abs/1608.079116》

这篇是用同样的点云编码方法来做激光里程计。

点云二维编码：

将点云P编码为一个二维矩阵（图像）。
首先将原始点云按照角度和激光的线束，划分为一个个polar bin:
在这里插入图片描述

这样每一个polar bin 可以用坐标（r，c）来表示。r为激光的线束，c表示角度；在二维矩阵中对应像素点（r，c）：
在这里插入图片描述

由于使用64线的雷达，二维图像的高是64
图像是3通道的，分别记录了每个polar bin 中的所有点云的深度，高度，强度
$∑p∈br,c[py,∥px,pz∥2,pi]∣br,c∣\frac{\sum_{\boldsymbol{p} \in \boldsymbol{b}_{\boldsymbol{r}, \boldsymbol{c}}}\left[p^{y},\left\|p^{x}, p^{z}\right\|_{2}, p^{i}\right]}{\left|\boldsymbol{b}_{\boldsymbol{r}, \boldsymbol{c}}\right|}$

网络结构

使用多帧输入提升鲁棒性；

使用两个不同的孪生神经网络进行旋转、平移预测，即用CNN对每个输入图像对提特征然后用FC层将所有特征融合输出R或者T （regression CNN）
在这里插入图片描述

其中 CNN part 的结构为：

在这里插入图片描述

这种分别单独预测的方法大幅提高了平移量的预测精度。（然而在相机重定位中，两个一起预测可以共享特征提升精度。）
然而，旋转精度还是很差。这里将旋转量的预测视为了回归问题，但是在里程计任务中前后帧的差别很小，因此旋转量的解空间也很小，通过密集采样可以将其转换为一个分类问题：
$R=arg⁡max⁡i∈{0,…,K−1}Γ(Ri(Mn),Mn−1)Γ:M2→R\begin{array}{c} R=\arg \max _{i \in\{0, \ldots, K-1\}} \Gamma\left(R_{i}\left(\boldsymbol{M}_{\boldsymbol{n}}\right), \boldsymbol{M}_{\boldsymbol{n}-1}\right) \\ \Gamma: \mathbb{M}^{2} \rightarrow \mathbb{R} \end{array}$
这里M是编码后的点云图像。
对应的网络结构就变成了（classification CNN）
在这里插入图片描述

即将当前帧点云随机旋转多次后和前一帧一起成对的输入CNN和FC网络，最后用softmax对结果进行评分，
这里的CNN part 也进行了改进：图像的水平分辨率也增加到了1800（分辨率提高增加了性能，对应的卷积核size也做了修改）
在这里插入图片描述

注意为了减少采样的数量，作者将xyz三个轴的旋转分开，使用三个CNN对其分别进行预测

最优旋转预测量的选择

选择可能性最大的（softmax 输出最高的）
或者使用加权平均：
$R∗=∑i∈SWp(Ri)⋅Ri∑i∈SWp(Ri)R^{*}=\frac{\sum_{i \in S_{W}} p\left(R_{i}\right) \cdot R_{i}}{\sum_{i \in S_{W}} p\left(R_{i}\right)}$