深度学习基础--卷积神经网络的不变性

本文深入探讨了卷积神经网络(CNN)的三种关键不变性:平移不变性、旋转及视角不变性和尺寸不变性。通过大量数据和特定网络结构如pooling操作,CNN实现了对图像变化的鲁棒性。特别地,文章分析了平移不变性的来源,并讨论了Inception模块如何应对尺寸变化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

卷积神经网络的不变性

  不变性的实现主要靠两点:大量数据(各种数据);网络结构(pooling)

不变性的类型

  1)平移不变性
  卷积神经网络最初引入局部连接和空间共享,就是为了满足平移不变性。
  关于CNN中的平移不变性的来源有多种假设。
  一个想法是平移不变性是由于连续卷积层中神经元的感受野尺寸增加。另一个可能性是不变性是由于pooling操作。我们开发了一个简单的工具,即平移灵敏度图,我们用它来可视化和量化各种体系结构的平移不变性。我们得到了令人惊讶的结果,诸如池层数和卷积滤波器大小之类的架构选择仅对网络的平移不变性具有次要影响。

  2)旋转和视角不变性
  个人觉得卷积神经网络克服这一不变性的主要手段还是靠大量的数据。并没有明确加入“旋转和视角不变性”的先验特性。Deformable Convolutional Networks似乎是对此变性进行了进行增强。

  3)尺寸不变性
  我们知道filter的size是事先选择的,而不同的尺寸所寻找的形状(概念)范围不同(就是说感受野不同)。可以说Inception是为了尺寸不变性而引入的一个先验知识。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值