数据挖掘06

数据挖掘06

1.卷积神经网络

卷积神经网络(Convolutional Neural Network,简称 CNN)是一种专门用于处理具有网格结构数据的深度学习模型,

2.传统神经网络不具备不变性。

(1)什么是“不变性”?

在模式识别中,不变性指的是:当输入数据发生某种变换(如平移、旋转、缩放、光照变化等)时,模型的输出(如分类结果)保持不变。

例如:

一张猫的图片向左移动几个像素,模型仍应识别为“猫” → 平移不变性

(2)传统全连接神经网络为什么缺乏不变性?

1)全连接结构:每个输入像素(如图像中的每个像素点)都与下一层的神经元单独连接,权重独立。

2)没有空间结构感知:它把图像当作一维向量处理,完全忽略了像素之间的空间局部关系。

3)对位置敏感:如果目标物体在图像中移动了,输入向量就完全不同,网络可能无法识别。

3.卷积神经网络的组成

(1)卷积层(Convolutional Layer)

(2)池化层(Pooling Layer)

(3)激活函数(Activation Function)

(4)关键要素

在这里插入图片描述

(5)卷积操作

对应点乘再求和,得到一个新值。

有单通道和双通道。

先 举个单通道的例子:
在这里插入图片描述
在这里插入图片描述
输出矩阵左上角的元素 0 = 0×0+ 0×1 + 0×2 + 0×3

算法是一样的,多通道就是要对每个通道点乘求和,只不过多了一步把各个通道的结果相加。

再举个双通道的例子:

在这里插入图片描述

(4)卷积输出尺寸计算公式:

在这里插入图片描述

如果卷积核不是正方形,可分别对高和宽计算。

在这里插入图片描述

(备注:如果结果不是整数,通常向下取整(floor),表示无法完整滑动时丢弃边缘)

总结:

(输入 + 2×padding − 卷积核) ÷ 步长,向下取整再加1

(5)怎么理解卷积输出尺寸?

1)举个例子

在这里插入图片描述

2)为什么是 “−K”?

因为卷积核必须完全落在有效区域内。

比如有 5 个位置,但一个 3 单位宽的窗口只能从位置 0、1、2 开始,否则会“伸出边界”。

4.通过例题加深理解

(1)例题1单选

题目:在卷积神经网络(CNN)中,下列关于卷积操作的描述,错误的是哪一项?

A. 卷积操作可有效提取图像的局部特征

B. 卷积核的权重在网络训练过程中保持不变

C. 通过调整步长(stride)可影响输出特征图的尺寸

D. 填充(padding)操作可避免特征图尺寸过快减小

答案:B

理由:

在训练过程中,卷积核的权重是可学习参数,会通过反向传播和优化算法(如SGD、Adam)不断更新。如果权重“保持不变”,模型就无法学习任何特征,完全失去意义。

(2)例题2单选

题目:在卷积神经网络(CNN)中,下列哪一项因素不会直接影响卷积层输出特征图的尺寸?

A. 卷积核大小(Kernel size)

B. 步长(Stride)

C. 激活函数的类型(Activation function)

D. 填充的大小(Padding)

答案:C

理由:

因为它不改变特征图的空间尺寸,只是对每个像素值做非线性变换。

(3)例题3多选

在这里插入图片描述
答案:ABCE

理由:偏差是由损失函数来衡量的,优化器是根据这个偏差进行参数调整的工具。优化器并不估计偏差,所以D错误。

(4)例题4多选

在这里插入图片描述
答案:ABC

理由:

单层神经网络可以表示非线性,只要使用非线性激活函数(如Sigmoid、ReLU)。

(5)例题5单选

在这里插入图片描述
答案:A

理由:

每个像素对应一个输入神经元 → 输入层有 10⁶ 个神经元

每个像素有 1 个隐藏层节点接收并处理 → 隐藏层有 10⁶ 个神经元

全连接结构:每个输入神经元都连接到每个隐藏层神经元

那么就有:

权重数=输入层神经元数×隐藏层神经元数

所以选A

(6)例题6多选

在这里插入图片描述
答案:AC

理由:
想象你有一张大信封(代表输入图像),你要在上面贴很多小邮票(代表卷积核)来“盖章认证”每一个区域。

每张贴上的邮票必须完全落在信封上(这是标准卷积,不越界);
你从左到右、从上到下移动邮票,每次移动一小步(比如1格);
信封中间的区域会被很多邮票覆盖(比如某个中心点,可能出现在几十张贴纸的中间);
但信封最边缘的一圈(比如最左边一列、最上一行)

只有当邮票刚好靠边时才能盖到,

所以只被盖1次或2次,甚至某些角落只被盖1次!

结果:边缘信息“认证不足”,容易被忽略!

A. 对图像边缘进行扩充(比如用白色填充)
相当于:把信封四周加一圈白纸边(像相框一样)!

原来的边缘像素现在变成了“新信封”的内圈,有效,A对

B. 使用更大的邮票(更大的卷积核)
相当于 邮票变大了(比如从3×3变成7×7)!

问题更严重了!因为大邮票更难贴到角落;所以B错

C. 使用更小的邮票(比如1×1或3×3)
小邮票更容易贴到边缘,确实能多盖几次边缘。
所以C对

D. 每次移动邮票的步子更大(比如跳2格)

相当于 邮票跳着走!

很多地方直接跳过,边缘更可能被漏掉;D错

(7)例题7单选

在这里插入图片描述
答案:A

(8)例题8多选

在这里插入图片描述
答案:ABCD

5.池化

(1)定义

池化(Pooling)是卷积神经网络(CNN)中一种重要的下采样(downsampling)操作。

(2)目的

1)降维:减小特征图尺寸,节省计算资源。

2)防止过拟合:通过丢弃部分细节信息,提升泛化能力。

3)增强平移不变性:即使目标在图像中轻微移动,池化后的结果变化不大。

4)突出主要特征:保留最显著的响应(如最大值),抑制噪声。

(3)常见池化类型

1)最大池化(Max Pooling)

在每个局部窗口中取最大值作为输出。

2)平均池化(Average Pooling)

在窗口内取平均值。

(4)池化的参数

和卷积类似,池化也有:

1)池化窗口大小(pool size):如 2×2

2)步长(stride):通常等于窗口大小(如 stride=2 表示不重叠滑动)

3)填充(padding):较少使用,但某些框架支持

不同的是:

池化没有可学习参数!它是一个固定的、确定性的操作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值