深度学习卷积和计算讲解

最新推荐文章于 2024-08-11 22:26:10 发布

原创最新推荐文章于 2024-08-11 22:26:10 发布 · 2.1k 阅读

·

1

·

CC 4.0 BY-SA版权

Author:baiyun ,Email:mitbaiyun@163.com

文章标签：

#深度学习 #卷积 #计算机视觉 #神经网络 #卷积神经网络

放图

在这里插入图片描述

输入是55的图片，有三个通道，即R、G 、B，也可以理解深度为3，从三个不同角度看图片，输入就是55*3,里面的每个像素或者元素都是输入x.

为了避免全连接导致参数太多，训练复杂，引入卷积核，从小角度看图片，而不是整体看图片。下图是553的卷积核，输入是32323，输出是深度为6，图片是2828，则采用卷积和：（55*3+`1`）6=456个参数，那个`1`是偏置b;采用全连接参数是（32323）(2828)6=`?`

在这里插入图片描述

卷积核是33`3`，是自己定义的，一般是55`3`、33`3`、77`3`、1111`3`这几个奇数，红色的`3`是对应rgb三通道，里面的每个元素值相当于权重w。

步长可以理解为滑窗，按照3*3的窗口在图片上左右，上下滑动。

$假如步长为3，则w−f+ss=图片宽−卷积核宽+步长步长=5−3+33=1.7假如步长为3，则\frac{w-f+s} {s}=\frac{图片宽-卷积核宽+步长} {步长}=\frac{5-3+3} {3}=1.7$

不能整除时，为了不丢失最后一列和最后一行的像素，可以填充列和行，一般框架自己维护，先填充一列，如果不能整除，再加一列，尽量最少的填充，上图是填充了1列1行，553=》663的图片了。

$p+w−f+ss=填充列+图片宽−卷积核宽+步长步长=1+5−3+33=2\frac{p+w-f+s} {s}=\frac{填充列+图片宽-卷积核宽+步长} {步长}=\frac{1+5-3+3} {3}=2$

还是以上图的步长为1考虑，多扩了2列2行，来计算卷积核的公式：

在这里插入图片描述

得到R与w1[:,:,0]的卷积和00+0(-1)+2*(-1)等等R1，G与w1[:,:,1]的卷积和G1，B与w1[:,:,2]的卷积和b1,

最后的卷积和=R1+G1+B1+b1=-1,b1是偏置项，目的与机器学习中wx+b=y的道理差不多，只是x代表RGB三个通道33`3`中的元素即特征，w代表三组w1中每个元素的值也是33`3`

在这里插入图片描述

输入层是553，增加填充列和行，变成77`3`，卷积核是两组的33`3`的，两组决定输出层深度是2，即有两个输出，即是输出层的深度

上图中的输出层为332，如果有50组333的卷积核，输出层就会有50的深度，输出层为3350，深度指从不同角度去看图片，比如形状，颜色。

33`3`（这是一组，分别对应rgb三个通道的卷积核）卷积核中每个元素的初始值任意指定，最后由模型训练得到，可以定义N组，就可以输出深度为N的输出层，越多越能从更多角度发掘图像特征，相应计算也会更大

输入层深度由输入决定，一般都是RGB三通道，输出层深度由自己设置W的组数决定，下图每一个平面都代表一个深度。

在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

BigData-0 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。