1.为什么使用卷积层(卷积层参数少的原因)
我们构建一个神经网络,第一层含有3072个单元,第二层含有4074个单元,如果采用全连接层,两层每个神经元彼此相连,需要计算3072*4704=14M权重参数;如果是卷积层,要计算5*5+1=26,26*6=156个参数。
卷积层参数少的原因(如上图):
1.权重共享:过滤器的特定特征检测功能适合于输入图像的全部区域,所以一个f*f过滤器和图像进行卷积计算时,使用共享的f*f个过滤器权重参数对整个图像检测特定特征
2.稀疏连接:输出矩阵某个值仅是输入矩阵某个局部区域计算得来,相当于仅与这部分区域相连接。
卷积神经网络善于捕捉平移不变,例如向右移动几个像素,卷积神经网络也会对图片有同样的输出标记。
2.整合各层,看看如何训练网络
卷积层、池化层、全连接层有不同参数w、b,我们要做的是用梯度下降或者其它算法优化参数,来减少代价函数的值。