论文阅读RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

RandLA-Net：大规模点云处理新方法

原创

已于 2024-07-02 12:09:58 修改 · 1.3k 阅读

·

27

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2023-11-30 10:13:08 首次发布

由于依赖计算量极大的采样技术或计算繁重的预/后处理步骤，大多数现有方法只能在小规模点云上进行训练和操作，RandLA-Net提出了一种新的方法，使得能够在大规模点云上运行。
RandLA-Net的关键在于使用随机点采样，而不是更复杂的点选择方法。虽然随机抽样具有显著的计算和内存效率，但可能会偶然丢弃关键特征。为了克服这一问题，引入了局部特征聚合模块，以逐步增加每个三维点的感受野，从而有效地保留几何细节。

目录

1. 文章做出的贡献
2. 随机采样方法的对比
3.局部特征汇集模块
4.网络结构

1. 文章做出的贡献

比较了不同采样方法，最终采用随机采样作为RandLA-Net使用的的采样方法。
提出局部特征聚合模块，逐步增加每个点的感受野，保留复杂的局部结构以此弥补随机采样损失的信息。
大量对比实验

2. 随机采样方法的对比

由于计算力以及实时性要求的限制，在处理大规模点云数据时，不可避免的要进行下采样，与此同时要求不丢失有用特征信息。
在 RandLA-Net 的每一层中，大规模点云都被大幅降低采样率，但仍能保留准确分割所需的特征。在这里插入图片描述

2.1抽样方法分类

现有的点采样方法大致可分为启发式方法和基于学习的方法。然而，目前仍没有适合大规模点云的标准采样策略，因此对这两种做了对比：

启发式采样：
- a.最远点采样： 取出k个点，其中每个点距离剩余k-1个点的距离最远，但是计算量太大。O(N²)
- b.逆密度重要性采样: 根据密度对n个点进行排序，取得前K个点作为采样点。相比于FPS要快，但是还不够快。O(N)
- c.随机采样: 从原来的N个点中均匀选取K个点。O(1)
启发式基于学习的采样：
- a.基于生成器的采样： 通过学习生成一小部分点集，以近似表示原始的大点集。但是常常包括FPS，因此很慢。
- b.基于连续松弛的采样
- c.政策梯度采样

2.2采样方法对比

不同采样方法的时间和内存消耗。由于 GPU 内存有限，虚线表示估计值。
在这里插入图片描述

2.3选择随机采样

综合对比之下，随机抽样有以下两个优点：

与输入点总数无关，因此计算效率极高
不需要额外的计算内存

但是由于随机采样会造成有效特征点信息的丢失，因此接下来提提出了局部特征汇集模块，用以弥补这种损失。

3.局部特征汇集模块

局部特征聚合模块并行应用于每个三维点，它由三个神经单元组成：

局部空间编码（LocSE）
注意力汇集
扩张残差块。

3.1 局部空间编码

给定点云 P 和每个点的特征（如原始 RGB 或中间学习特征），该局部空间编码单元会明确嵌入所有相邻点的 x-y-z 坐标，从而使相应的点特征始终知道它们的相对空间位置。
具体步骤如下：

寻找邻近点：其邻近点首先通过简单的近邻算法（KNN）收集，以提高效率。
相对点位置编码：
$r_{i}^{k} = MLP(p_{i}⊕p_{i}^{k}⊕(p_{i}-p_{i}^{k})⊕||p_{i}-p_{i}^{k}||)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。