《动手学深度学习》Task5-优快云博客

本文链接：https://blog.youkuaiyun.com/yq313210/article/details/104372781

1.卷积神经网络基础；

对于CNN中一些概念的理解

1.feature map
在CNN的各个卷积层中，数据都是以３维形式存在的。我们可以把它看成许多个２维平面图叠在一起，其中每个２维图称为一个feature map　.
在输入层，如果是灰度图，只有一个feature map；如果是彩色图片，一般是3个feature map（RGB）。
其他层：层与层之间会有若干个卷积核(kernel),上一层每个feature map跟每个卷积核做卷积，都会产生下一层的一个feature map，如果有N个卷积核，下一层就会产生N个feature map.
2.多个feature map 的作用是什么
在CNN中，我们希望用一个网络模拟视觉通路的特性，分层的概念是自底向上构造简单到复杂的神经元。
下面只考虑某一层，在CNN中，在同一层，我们希望得到对于一张图片多种角度的描述，具体来讲就是用多种不同的卷积核对图像进行卷积，得到不同核上的响应，作为图像的特征。相当于我们通过描述某个人的身高／体重等特征来描述一个人。换到图像上来说，相当于形成图像在同一层次不同基上的描述。
下层的核主要是一些简单的边缘检测器，上层的核主要是一些简单核的叠加。具体多少个
ｆｅａｔｕｒｅｍａｐ，　简单问题少，复杂问题多，但自底向上一般是核的数量变多（但也有例外，如Ａｌｅｘｎｅｔ），主要靠经验
3.卷积核的形状
每个卷积核具有长、宽、深三个维度。在CNN的一个卷积层中：

卷积核的长、宽都是人为指定的，长X宽也被称为卷积核的尺寸，常用的尺寸为3X3，5X5等；
卷积核的深度与当前图像的深度（feather map的张数）相同，所以指定卷积核时，只需指定其长和宽两个参数。例如，在原始图像层（输入层），如果图像是灰度图像，其feather map数量为1，则卷积核的深度也就是1；如果图像是grb图像，其feather map数量为3，则卷积核的深度也就是3.
还有一些细节参考原文链接
CNN基础概念及计算过程