目录
1.卷积神经网络的概念
卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一 [1-2] 。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为“平移不变人工神经网络(Shift-Invariant Artificial Neural Networks, SIANN)。
2.卷积神经网络应用领域
卷积神经网络应用领域非常广泛,主要应用于有关图像相关的,例如:图像分类、图像语义分割、图像检索、物体检测等计算机视觉的问题,还有CV领域的发展,超分辨率重构,医学任务,无人驾驶,人脸识别等领域。
3.卷积的作用
3.1卷积神经网络与传统神经网络的区别
卷积神经网络相较于传统神经网络而言,不再是单指一列,不是一个向量,不是一个特征,而是一个三维的矩阵。
3.2整体架构
一个卷积神经网络主要由以下5种结构组成:
1.输入层。输入层是整个神经网络的输入,在处理图像的卷积神经网络中,它一般代表了一张图片的像素矩阵。比如在图6-7中,最左侧的三维矩阵的长和宽代表了图像的大小,而三维矩阵的深度代表了图像的色彩通道(channel)。比如黑白图片的深度为1,而在RGB色彩模式下,图像的深度为3。从输入层开始,卷积神经网络通过不同的神经网络结构下将上一层的三维矩阵转化为下一层的三维矩阵转化为下一层的三维矩阵,直到最后的全连接层。
2.卷积层。
简单来说,就是提取特征。我们都知道,一个照片有许多个像素点组成,按照上图来说,首先,我们先把图像(image)进行一个分割,分割成许多块,那么每一块就是由多个像素点组成的,通过从每一块中进行特征提取,通过权重参数来得到一个特征值。我们从中抽取出其中一个“1”小块,然后假设它是一个5*5的区域,通过一 一在每一个3*3大小的区域内(如下图区域1,2,3)选出来一个特征,因为每一个区域出来的特征是不一样的,接下来选择一个计算的方法对于每一个小区域进行计算它应该的特征值是等于多少。下面,我们对选出来的“区域1”进行,其对应一个权值参数矩阵w1=[0,1,2;2,2,0;0,1,2],将 区域“1”与w1作内积运算,那么就可以得出区域“1”对应的特征值即为“12”,经过一次卷积,就可以得到右边那个绿色的特征图了(一个颜色通道的特征图)
那么,那个“32*32*3”中“3”是什么呢?