卷积神经网络(CNN)由输入层、卷积层、激活函数、池化层、全连接层组成,即INPUT-CONV-RELU-POOL-FC
(1)卷积层:用它来进行特征提取,如下:

输入图像是32*32*3,3是它的深度(即R、G、B),卷积层是一个5*5*3的filter(感受野),这里注意:感受野的深度必须和输入图像的深度相同。通过一个filter与输入图像的卷积可以得到一个28*28*1的特征图,上图是用了两个filter得到了两个特征图;
我们通常会使用多层卷积层来得到更深层次的特征图。如下:


关于卷积的过程图解如下:

输入图像和filter的对应位置元素相乘再求和,最后再加上b,得到特征图。如图中所示,filter w0的第一层深度和输入图像的蓝色方框中对应元素相乘再求和得到0,其他两个深度得到2,0,则有0+2+0+1=3即图中右边特征图的第一个元素3.,卷积过后输入图像的蓝色方框再滑动,stride=2,如下:

本文介绍了卷积神经网络(CNN)的基础结构,包括输入层、卷积层、激活函数、池化层和全连接层。卷积层用于特征提取,通过权值共享减少参数数量,例如,32*32*3的图像经过5*5*3的filter卷积得到28*28*1的特征图。池化层则用于压缩特征图,通常使用max pooling提取主要特征。全连接层连接所有特征,将输出送入分类器。CNN的优化通常关注卷积层的计算加速和全连接层的参数优化。
最低0.47元/天 解锁文章
679

被折叠的 条评论
为什么被折叠?



