用途:基于图像的识别,分类等操作
输入图像-〉(1)卷积-〉激活函数-〉pooling-〉(1)

卷积层:提取特征,得到特征图
输入的shape:( 7* 7 *3)RGB : 3通道 所以为3层 第一层R ;第二层G;
如果偏移量(Stride)为1,产生的结果的个数偏大,计算内积的计算量大;如果偏移量过大,有些特征就会被忽略;
引入Pad:图中偏移量为2,使得1、2重复计算,边缘的数值只计算了一次,故向外四周填充0(填充的0是对提取特征是没有意思的);Pad为n,就向四周填充n圈0;
filter是 w0或。。。。wj:用来和截取的输入(多大的区域进行特征提取)来内积的,提取特征,以后会反复优化这个w,和线性回归一样。如 (3 *3 *3)(RGB为3)
问题是:如何求出最终的结果的shape;
公式: h(out)=(h(原来的)+2*Pad-filter)/Stride+1=(7+2 *1-3)/1+1=6+1=7;
w(out)=(w(原来的)+2*Pad-filter)/Stride+1=(7+2 *1-3)/1+1=6+1=7;
故最终结果的shape: 7 *7 *3(filter的个数,这里filter有3个)


卷积参数共享
池化层(pooling):压缩特征图(max、mean方法)

本文深入探讨了卷积神经网络的基础原理,包括卷积层如何提取图像特征,池化层的作用,以及如何计算输出形状。介绍了偏移量、填充和过滤器在特征提取中的应用。
840

被折叠的 条评论
为什么被折叠?



