Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud
论文:
https://arxiv.org/pdf/2003.01251v1.pdf
代码:
https://github.com/WeijingShi/Point-GNN
摘要
本文提出了一种基于图神经网络的激光雷达点云目标检测方法。我们在固定半径的近邻图中对点云进行了有效的编码。我们设计了一个图神经网络(Point-GNN)来预测类别和图中顶点所属对象的形状。在Point-GNN中,我们提出一个自动配准( auto-registration)的机制来确保平移不变性 (translation variance),并且设计了一种方框合并和评分操作,将多个顶点的检测结果准确地组合在一起。我们在KITTI上的实验证明了:仅用点云就能获得领先的精度,甚至可以超过基于融合的算法。我们的结果证明了图神经网络作为一种新的三维目标检测方法的潜力。
简介
在机器人感知中,理解3D环境至关重要。点云(空间中一组点)是三维传感器(如LiDAR)的一种广泛使用的格式。在自动驾驶等应用中,从点云中准确地检测对象是至关重要的。
卷积神经网络从图像中检测目标依赖于卷积运算,卷积运算是高效的,但是需要规则网格作为输入。点云通常是稀疏、不均匀,将点云放置在规则网格上会导致分布不均匀,在对这些放置点云的网格进行卷积操作时,可能会导致拥挤单元中信息丢失或者空单元中浪费计算资源。
神经网络最近期发展允许以无序的点云作为输入,利用此类的神经网络来提取点云特征,并需要之前的将点云放置到网格中的操作。但是他们需要对点云进行取样和分组(sample and group points iteratively),来得到点云表示。在大型点云数据上进行迭代分组和取样会导致计算成本非常昂贵,最近的一些三维检测方法采用混合方法在不同阶段使用网格和点云进行表示,,虽然取得了一定的效果,但是这种混合策略可能会受到两种方法缺陷的影响。
在本文中,我们提出了一种使用图作为点云紧凑表示的方法,设计Point-Net的图神经网络来检测目标,我们使用将点作为图顶点来对点云进行编码,图的边位于固定半径内的邻域点连接起来,这样特征信息就可以在邻域之间流动。这样的结构可以直接适应点云的特征,不需要为其创建新的规则。在每一层中,图卷积都重复的使用图的节点和边,这样避免了对点的迭代分组和采样。
研究【15】【9】【2】【17】研究了使用图神经网络对点云进行分类和语义分割。然而,很少有研究考虑使用图形神经网络来检测点云中的3D对象。我们的工作证明了在点云中使用GNN进行高精度目标检测的可行性。
我们提出的图神经网络Point-GNN以点图为输入。它输出每个顶点所属对象的类别和边界框。Point-GNN是一种在单次拍摄中检测多个对象的一阶段检测方法。为了保证图神经网络中的平移不变性,我们引入了一种自动配准机制,允许点根据其特征对齐它们的坐标。在此基础上,设计了一种方框合并和评分操作,对多个顶点的检测结果进行了准确的组合。
在KITTI基准测试方法有效性的过程中,Point-GNN仅使用点云就达到了最先进的精度,甚至超过了传感器融合方