【论文详解】Sparsity Invariant CNNs

最新推荐文章于 2024-07-04 17:50:28 发布

原创

最新推荐文章于 2024-07-04 17:50:28 发布 · 1.7k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文提出了一种针对稀疏输入的卷积神经网络（CNN）解决方案，特别关注于处理如激光雷达扫描等数据。传统CNN在处理稀疏数据时表现不佳，而新方法通过引入稀疏卷积层，考虑输入像素的有效性，增强了模型对输入稀疏性的不变性。实验表明，即使训练和测试数据的稀疏度不同，该网络仍能保持稳定性能。此外，该方法还探讨了如何将2.5D特征表示用于处理不规则和稀疏的激光扫描数据，改善了处理效果。

Abstract

本文主要研究了稀疏输入下的卷积神经网络，并用稀疏的激光雷达扫描数据进行实验。传统的CNN在输入稀疏数据时性能很差，即使提供了丢失数据的位置，效果也不理想。为了解决这个问题，本文提出了一个简单有效的稀疏卷积层，在卷积运算中明确考虑了丢失数据的位置。

1.Introduction

卷积神经网络CNN几乎影响了计算机视觉的所有领域。通常情况下，CNN的输入是一个图像或者视频，用稠密的矩阵或者张量表示。通过将卷积层与非线性层、池化层结合，CNN能够在第一层提取低层次特征，然后再后续层中依次学习更高层次的特征。然而，当网络的输入是稀疏或者不规则的（例如只有10%的像素携带有用信息），对于每个滤波器的位置该怎样定义不十分明确，输入的数量和位置会发生变化。

为了解决这个问题，一个简单的方法是给所有无信息的位置分配一个默认值，但是这种方法只能得到次优的结果，因为过滤器必须对所有可能的激活模式保持不变，其数量随着过滤器的尺寸呈指数增长。

本文提出了一个简单有效的解决方案：引入了一个稀疏的卷积层，它根据输入像素的有效性对卷积核的元素进行加权。此外，第二个stream将关于像素有效性的信息传送给网络的后续层。

重要的是，实验证明，该网络对不同稀疏程度的输入数据都有很好的效果，训练数据和

最低0.47元/天解锁文章

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。