【总结】关于CNN

最新推荐文章于 2024-07-27 19:20:14 发布

原创

最新推荐文章于 2024-07-27 19:20:14 发布 · 213 阅读

0 ·

CC 4.0 BY-SA版权

本文深入探讨了CNN的核心概念，包括卷积层的本质——稀疏交互和参数共享，以及与全连接层的关系。还阐述了通道（channel）的意义，CNN的整体流程和平移不变性。此外，介绍了池化层的作用、种类及其反向传播过程，并讨论了CNN的局限性和解决方案，如空洞卷积（Dilated CNN）和迭代空洞卷积。最后，简要概述了反卷积的原理和用途。

【总结】关于CNN

文章目录

【总结】关于CNN

脑图：

在这里插入图片描述

一、动机篇

全连接网络：任意一对输入与输出神经元间都存在连接，现成稠密结构
局部特征存在相关性

二、CNN 卷积层篇

2.1 卷积层的本质是什么？

稀疏交互
- 动机：全连接网络，任意一对输入与输出神经元间都存在连接，现成稠密结构
- 思路：卷积核尺度远小于输入维度，每个输出神经元仅与前一层特定局部区域内的神经元存在连接
- 优点：全连接层的参数为 mn；卷积层为 kn (m为输入，n为输出，k 为卷积维度)
参数共享
- 思路：在同一模型的不同模块中使用相同参数，为卷积运算的固有属性
- 区别
  - NN：计算每层输出时，权值参数矩阵中每个元素只作用于每个输入元素一次
  - CNN：卷积核中每个元素将作用于每个局部输入的特定位置上
- 物理意义：使卷积层具有平移不变性 (满足 f(g(x)) = g(f(x)) 时，称 f(x) 关于g 具有等变性)

2.2 CNN 卷积层与全连接层的联系？

卷积核中的权值每次滑动计算时只是局部连接，且在卷积列中的神经元共享参数——计算局部信息，而全连接层神经元的权值与所有输入相连——计算全局信息。
两者都是采用的矩阵点积运算，具有相似的计算形式，能够实现互相转化。
1. 卷积——>全连接： 权重矩阵参数增大，权重补0，由于参数共享性质，在其中大部分块中，存在大量相等参数。
2. 全连接——>全卷积： 将卷积核的尺寸设置为和输入数据体的尺寸一致（NxWxHxC）。除第一层全连接外，其他通道数都为1，N表示本层神经元的个数，为一个提前设定的超参数，结果与初始的那个全连接层一致。
一个深度卷积神经网络模型通常由若干卷积层叠加若干全连接层组成，中间也包含各种非线性操作以及池化操作。卷积层的作用是从输入数据中采集关键数据内容。全连接层在深度卷积神经网络中的作用是将前面经过多次卷积后高度抽象的特征进行整合。最后一层作归一化，然后输出概率。卷积层提供了一个有意义、低维度且几乎不变的特征空间，然后全连接层在这个空间里学习一个非线性的方程。通俗的说，卷积层是特征提取器，全连接层执行分类操作。
全连接层可以视作一种特殊的卷积。考虑下面两种情况：
1. (1) 特征图和全连接层相连，AlexNet经过五次池化后得到7*7*512的特征图，下一层全连接连向4096个神经元，这个过程可以看作有4096个7*7*512的卷积核和7*7*512的特征图进行卷积操作，最终得到1*1*4096的特征图，等价于全连接得到4096个神经元。
2. (2) 全连接层和全连接层相连，AlexNet的再下一层依然是4096个神经元，即4096个神经元和4096个神经元全连接，由(1)得到了1*1*4096的特征图，本次全连接过程可以看作存在4096个1*1*4096的卷积核，依次和1*1*4096的特征图进行卷积操作，等价于全连接。

2.3 channel的含义是什么？

在卷积神经网络中，channel的含义是每个卷积层中卷积核的数量。卷积层的卷积个数就等于卷积层输出的out_channels。这个值也与下一层卷积的in_channels相同。下面举例说明。

如下图，假设现有一个为 6×6×3 的图片样本，使用 3×3×3 的卷积核（filter）进行卷积操作。此时输入图片的 channels 为 3 ，而卷积核中的 in_channels 与需要进行卷积操作的数据的 channels 一致（这里就是图片样本，为3）。

在这里插入图片描述

接下来，进行卷积操作，卷积核中的27个数字与分别与样本对应相乘后，再进行求和，得到第一个结果。依次进行，最终得到 4×4的结果。

在这里插入图片描述

上面步骤完成后，由于只有一个卷积核，所以最终得到的结果为 4×4×1， out_channels 为 1 。

在实际应用中，都会使用多个卷积核。这里如果再加一个卷积核，就会得到 4×4×2 的结果。

在这里插入图片描述

总结一下， channels 分为三种：

最初输入的图片样本的 channels ，取决于图片类型，比如RGB；
卷积操作完成后输出的 out_channels ，取决于卷积核的数量。此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channels；
卷积核中的 in_channels ，就是上一次卷积的 out_channels ，如果是第一次做卷积，就是样本图片的 channels 。