深度学习的数学-卷积神经网络的结构和变量关系

最新推荐文章于 2023-05-30 22:16:55 发布

藏锋入鞘

最新推荐文章于 2023-05-30 22:16:55 发布

阅读量1.2k

点赞数

分类专栏：深度学习的数学文章标签：卷积神经网络深度学习

本文链接：https://blog.youkuaiyun.com/qq_34177812/article/details/104792628

版权

深度学习的数学专栏收录该内容

5 篇文章

订阅专栏

文章目录

排版可能好一点的永久博客链接：深度学习的数学-卷积神经网络的结构和变量关系

前言

本篇博客主要介绍卷积神经网络的组成部分，以及变量表示，最后附上卷积神经网络代价函数的计算

正文

前文中学到的神经网络都是全连接类型的，隐藏层对输入层有着各自固定的偏好模式，满足偏好模式（权重和偏置来控制）兴奋度会提高；
卷积神经网络在隐藏层也有类似的特性，不过整理偏好的过程是运动的，会将偏好兴奋结果整理到少量神经单元中，以减少神经单元数量，并且可以进行特定的模式识别，可能初看还无法理解这段话，看了下面的过滤器和特征映射应该就会明白了。

**本文中所有的例子均为：**建立一个神经网络，用于识别 6 * 6 的黑白图像中手写的 1 2 3，那么输入层神经单元就有 6行6列共 36 个

过滤器和特征映射（重点）

过滤器可以理解为一种偏好模式，比如像书中展示的一个过滤器S，对如下形式的图形敏感

那么，拿着这个过滤器，在例子中的 6 * 6 的图形中从左到右，从上到下依次识别，每次识别过滤器S那么大的区域，并将敏感度结果保存起来，相似度越高就越复合过滤器的偏好

得到的结果就是特征映射，也就是根据过滤器S得到的卷积
在这里插入图片描述

卷积层神经单元输出与池化

简单卷积后，神经单元依旧有 16 个，还是有点多，那么还可以做一个操作叫做池化，书中提到了三种池化方式，首先来看下最简单的最大池化，剩下的两种也很容易理解了

池化的目标就是减少神经单元的数量，但是又能代表卷积层中的结果数据，那么把整个神经单元拆成 2 * 2 的大区域，把每个大区域的最大值（最大输出）作为代表放到池化层的对应位置，即可得到池化的结果
在这里插入图片描述

三种池化方式

书中提到了如下三种池化方式：

最大池化，使用区域中最大值作为代表值
平均池化，使用区域中的平均值作为代表值
L2池化，使用平方和开方的值作为代表值， $\sqrt{a_1^2+a_2^2+a_3^2+a_4^2}$

变量和参数定义（重点）

书中给到了如下参数定义，结合第二幅图可能更能够理解
在这里插入图片描述
简单地说，输入层右上角带上了 I 表示Input，每个过滤器K对应了以 $w_{ij}^{Fk}$ 表示的神经单元，经过过滤器的卷积计算都对应生成的结果（特征映射结果），卷积层中的加权输入依旧用z表示、偏置用b表示、输出用a表示，不过右上角的F代表Filter；卷积层对应的池化层也是如此，但是池化层的神经单元输出等于输入，所以没有偏置；输出层的变化是，右上角带上了一个O，表示Output，学习数据与之前的别无二致
在这里插入图片描述

各个层的变量关系

输入层

输入层中的神经单元，输入等于输出，所以 $a_{ij}^I = x_{ij}$

过滤器和卷积层

过滤器，右上角的F代表 Filter，过滤器中的w同样代表了对应位置的神经单元与过滤器中神经单元的权重
在这里插入图片描述
所以第一块区域使用第一个过滤器得到的卷积结果 $c_{11}^{F1}=w_{11}^{F1}x_{11}+w_{12}^{F1}x_{12}+w_{13}^{F1}x_{13}....w_{33}^{F1}x_{33}$