深度学习基础入门篇(1)一 卷积神经网络CNN(Convolutional Neural Networks)

本文深入解析卷积神经网络(CNN)的结构与工作原理,包括输入层、卷积层、池化层、全连接层及输出层的运作机制。详细介绍了卷积过程、池化方法(Maxpooling与Averagepooling)以及特征图的生成,通过实例说明了卷积和池化操作在MTCNN中P-Net的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

@深度学习基础入门篇(1)一 卷积神经网络CNN(Convolutional Neural Networks)

结构:输入层、卷积层、池化层、全连接层、输出层

卷积神经网络结构如下图所示:在这里插入图片描述

通道和特征图详解

一、CNN–Convolution

如上图所示,左图为6 X 6 feature map(特征图),右图为若干个3 X 3 Filter(卷积核)
卷积过程如下:
当步长为1时
当步长为1时,Filter1与原特征图进行卷积,卷积过程为矩阵相应位置相乘之和。如图为:
1 * 1+0*(-1)+0*(-1)+0*(-1)+1 * 1+0*(-1)+0*(-1)+0*(-1)+1 * 1=3.
之后从左往右,从上向下依次卷积。得到4 X 4大小的新特征图。

新特征图的大小计算为: Sn = (S1-S2)/stride + 1 (其中Sn为新特征图大小,S1为原特征图大小,S2为卷积核大小,stride为步长,如:4 =(6-3)/1 + 1)

在这里插入图片描述
如图所示原特征图在两此卷积后生成的新特征图为 4 X 4 X 2,此时depth = 2,特征图的层数和卷积核数有关。

CNN-pooling

常用的池化方法有Max pooling和 average pooling。
     以上卷积后产生了4 X 4 X 2的新特征图

在这里插入图片描述
如上图所示对特征图进行2 X 2的池化,stride设定为2,经过Maxpooling和Average pooling分别得:
在这里插入图片描述
在处理池化过程中与卷积略有不同,池化的步长一般设置为与上一次不重叠(也有不同,见下文举例),如以上stride = 2.池化后的大小计算与卷积后的大小计算相似。

CNN-Flatten 和全连接

在这里插入图片描述
如上图,将池化后的特征图拉长,最后做全连接。

举例—MTCNN中P-Net说明卷积和池化操作:

在这里插入图片描述在这里插入图片描述

[1]: [B站李宏毅CNN视频](https://www.bilibili.com/video/av23593949? from=search&seid=17675224164423254630)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值