Abstract
本文主要研究了稀疏输入下的卷积神经网络,并用稀疏的激光雷达扫描数据进行实验。传统的CNN在输入稀疏数据时性能很差,即使提供了丢失数据的位置,效果也不理想。为了解决这个问题,本文提出了一个简单有效的稀疏卷积层,在卷积运算中明确考虑了丢失数据的位置。
1.Introduction
卷积神经网络CNN几乎影响了计算机视觉的所有领域。通常情况下,CNN的输入是一个图像或者视频,用稠密的矩阵或者张量表示。通过将卷积层与非线性层、池化层结合,CNN能够在第一层提取低层次特征,然后再后续层中依次学习更高层次的特征。然而,当网络的输入是稀疏或者不规则的(例如只有10%的像素携带有用信息),对于每个滤波器的位置该怎样定义不十分明确,输入的数量和位置会发生变化。
为了解决这个问题,一个简单的方法是给所有无信息的位置分配一个默认值,但是这种方法只能得到次优的结果,因为过滤器必须对所有可能的激活模式保持不变,其数量随着过滤器的尺寸呈指数增长。
本文提出了一个简单有效的解决方案:引入了一个稀疏的卷积层,它根据输入像素的有效性对卷积核的元素进行加权。此外,第二个stream将关于像素有效性的信息传送给网络的后续层。
重要的是,实验证明,该网络对不同稀疏程度的输入数据都有很好的效果,训练数据和

本文提出了一种针对稀疏输入的卷积神经网络(CNN)解决方案,特别关注于处理如激光雷达扫描等数据。传统CNN在处理稀疏数据时表现不佳,而新方法通过引入稀疏卷积层,考虑输入像素的有效性,增强了模型对输入稀疏性的不变性。实验表明,即使训练和测试数据的稀疏度不同,该网络仍能保持稳定性能。此外,该方法还探讨了如何将2.5D特征表示用于处理不规则和稀疏的激光扫描数据,改善了处理效果。
最低0.47元/天 解锁文章

2144





