40、卷积神经网络中的卷积与池化技术详解

卷积神经网络中的卷积与池化技术详解

1. 解决“边缘脱落”问题:填充技术

在处理图像时,“边缘脱落”是一个常见的问题。为了解决这个问题,我们可以在输入的边界周围添加填充(padding),也就是额外的元素。填充的厚度取决于滤波器的大小,通常我们会添加足够的填充,使得滤波器能够以输入的每个元素为中心进行卷积操作。如果不想在边缘处丢失信息,每个滤波器的输入都需要进行填充。

大多数深度学习库会自动计算所需的填充量,以确保输出的宽度和高度与输入相同,并将其作为默认设置应用。

2. 多维卷积

之前我们主要考虑的是只有一个颜色通道的灰度图像,但大多数彩色图像有三个通道,分别代表每个像素的红、绿、蓝成分。

2.1 多通道输入的处理

要处理具有多个通道的输入,滤波器需要具有相同数量的通道,因为输入中的每个值都需要在滤波器中有对应的匹配值。例如,对于RGB图像,滤波器需要有三个通道。一个3x3的滤波器就需要有三个通道,总共包含27个数值。

在将这个核应用于三通道彩色图像时,我们的操作方式与之前类似,但现在我们将其视为三维的块(或张量)。对于每个输入像素,我们将滤波器的核中心对准该像素,并将图像中的27个数值与滤波器中的27个数值进行匹配。

2.2 多通道卷积规则

为了确保每个输入值都有对应的滤波器值,我们可以总结出一个规则:每个滤波器的通道数必须与它所处理的张量的通道数相同。

3. 多个滤波器的使用

在实际应用中,我们通常会将数十或数百个滤波器组合成一个卷积层,并同时(且独立地)将它们应用于该层的输入。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值