图像识别中的卷积神经网络技术详解
1. 卷积层的优势与参数
卷积层在图像识别中表现出色,因为每个神经元仅从相邻神经元获取输入,无需关注远距离神经元的输入。在卷积层中,有两个重要参数:步长(Stride)和填充(Padding)。
- 步长 :指每次移动滤波器时跳过的像素(神经元)数量。例如,之前的例子中步长为 1,即每次滤波器移动 1 个像素。但步长也可以更大,如 2 或更多。步长越大,输出层的宽度和高度就越小。
- 填充 :是指在原始图像外部添加值为 0 的神经元。当需要输出图像与输入图像大小相同时,填充就非常有用。输出图像大小的计算公式如下:
- 设输入切片大小为 (I=(I_w, I_h)),滤波器大小为 (F=(F_w,F_h)),步长为 (S=(S_w,S_h)),填充为 (P=(P_w,P_h)),则输出切片大小 (O=(O_w,O_h)) 为:
- (O_w = \frac{I_w + 2P_w - F_w}{S_w} + 1)
- (O_h = \frac{I_h + 2P_h - F_h}{S_h} + 1)
- 需要注意的是,步长 (S) 必须能整除 (I + 2P – F) 在宽度和高度方向上的值。
- 使用的参数数量 (W) 与步长和填充无关,仅取决于滤波器的(平方)大小、输入的深度 (D)(切片数量)和所选的特征图数量 (M),计算公式为 (W = D \times F_w \times F_h \times M + 1)。
2. 池化层的作用与参数
卷积操作后,通常会进行池化操作。最经典的是最大池化(Ma
卷积神经网络图像识别技术解析
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



