14、图像识别中的卷积神经网络技术详解

卷积神经网络图像识别技术解析

青柠汽水308

于 2025-10-17 12:08:51 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习实战指南文章标签：卷积神经网络图像识别卷积层

本文链接：https://blog.youkuaiyun.com/solidity8miner/article/details/154374731

深度学习实战指南专栏收录该内容

32 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

图像识别中的卷积神经网络技术详解

1. 卷积层的优势与参数

卷积层在图像识别中表现出色，因为每个神经元仅从相邻神经元获取输入，无需关注远距离神经元的输入。在卷积层中，有两个重要参数：步长（Stride）和填充（Padding）。
- 步长：指每次移动滤波器时跳过的像素（神经元）数量。例如，之前的例子中步长为 1，即每次滤波器移动 1 个像素。但步长也可以更大，如 2 或更多。步长越大，输出层的宽度和高度就越小。
- 填充：是指在原始图像外部添加值为 0 的神经元。当需要输出图像与输入图像大小相同时，填充就非常有用。输出图像大小的计算公式如下：
- 设输入切片大小为 (I=(I_w, I_h))，滤波器大小为 (F=(F_w,F_h))，步长为 (S=(S_w,S_h))，填充为 (P=(P_w,P_h))，则输出切片大小 (O=(O_w,O_h)) 为：
- (O_w = \frac{I_w + 2P_w - F_w}{S_w} + 1)
- (O_h = \frac{I_h + 2P_h - F_h}{S_h} + 1)
- 需要注意的是，步长 (S) 必须能整除 (I + 2P – F) 在宽度和高度方向上的值。
- 使用的参数数量 (W) 与步长和填充无关，仅取决于滤波器的（平方）大小、输入的深度 (D)（切片数量）和所选的特征图数量 (M)，计算公式为 (W = D \times F_w \times F_h \times M + 1)。