卷积神经网络中的卷积与池化技术详解
1. 解决“边缘脱落”问题:填充技术
在处理图像时,“边缘脱落”是一个常见的问题。为了解决这个问题,我们可以在输入的边界周围添加填充(padding),也就是额外的元素。填充的厚度取决于滤波器的大小,通常我们会添加足够的填充,使得滤波器能够以输入的每个元素为中心进行卷积操作。如果不想在边缘处丢失信息,每个滤波器的输入都需要进行填充。
大多数深度学习库会自动计算所需的填充量,以确保输出的宽度和高度与输入相同,并将其作为默认设置应用。
2. 多维卷积
之前我们主要考虑的是只有一个颜色通道的灰度图像,但大多数彩色图像有三个通道,分别代表每个像素的红、绿、蓝成分。
2.1 多通道输入的处理
要处理具有多个通道的输入,滤波器需要具有相同数量的通道,因为输入中的每个值都需要在滤波器中有对应的匹配值。例如,对于RGB图像,滤波器需要有三个通道。一个3x3的滤波器就需要有三个通道,总共包含27个数值。
在将这个核应用于三通道彩色图像时,我们的操作方式与之前类似,但现在我们将其视为三维的块(或张量)。对于每个输入像素,我们将滤波器的核中心对准该像素,并将图像中的27个数值与滤波器中的27个数值进行匹配。
2.2 多通道卷积规则
为了确保每个输入值都有对应的滤波器值,我们可以总结出一个规则:每个滤波器的通道数必须与它所处理的张量的通道数相同。
3. 多个滤波器的使用
在实际应用中,我们通常会将数十或数百个滤波器组合成一个卷积层,并同时(且独立地)将它们应用于该层的输入。
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



