卷积神经网络的问题

本文深入探讨了卷积神经网络的基础原理,包括卷积层如何提取图像特征,池化层的作用,以及如何计算输出形状。介绍了偏移量、填充和过滤器在特征提取中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用途:基于图像的识别,分类等操作

输入图像-〉(1)卷积-〉激活函数-〉pooling-〉(1)

在这里插入图片描述

卷积层:提取特征,得到特征图

输入的shape:( 7* 7 *3)RGB : 3通道 所以为3层 第一层R ;第二层G;
如果偏移量(Stride)为1,产生的结果的个数偏大,计算内积的计算量大;如果偏移量过大,有些特征就会被忽略;
引入Pad:图中偏移量为2,使得1、2重复计算,边缘的数值只计算了一次,故向外四周填充0(填充的0是对提取特征是没有意思的);Pad为n,就向四周填充n圈0;
filter是 w0或。。。。wj:用来和截取的输入(多大的区域进行特征提取)来内积的,提取特征,以后会反复优化这个w,和线性回归一样。如 (3 *3 *3)(RGB为3)

问题是:如何求出最终的结果的shape;

公式: h(out)=(h(原来的)+2*Pad-filter)/Stride+1=(7+2 *1-3)/1+1=6+1=7;
w(out)=(w(原来的)+2*Pad-filter)/Stride+1=(7+2 *1-3)/1+1=6+1=7;

故最终结果的shape: 7 *7 *3(filter的个数,这里filter有3个)
在这里插入图片描述
在这里插入图片描述

卷积参数共享

池化层(pooling):压缩特征图(max、mean方法)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值