卷积神经网络:从基础到实战
1. 卷积层的完整描述
卷积层接收一个输入体积,该输入体积具有以下特征:
- 宽度 $w_{in}$
- 高度 $h_{in}$
- 深度 $d_{in}$
- 零填充 $p$
这个输入体积由 $k$ 个滤波器进行处理,这些滤波器代表卷积网络中的权重和连接。滤波器有以下超参数:
- 空间范围 $e$,等于滤波器的高度和宽度。
- 步长 $s$,即滤波器在输入体积上连续应用的距离。若步长为 1,则得到上一节描述的完全卷积。
- 偏置 $b$,这是一个像滤波器中的值一样需要学习的参数,会加到卷积的每个分量上。
卷积操作的输出体积具有以下特征:
- 函数 $f$,应用于输出体积中每个神经元的输入对数几率,以确定其最终值。
- 宽度 $w_{out} = \frac{w_{in}-e + 2p}{s} + 1$
- 高度 $h_{out} = \frac{h_{in}-e + 2p}{s} + 1$
- 深度 $d_{out} = k$
输出体积的第 $m$ 个“深度切片”($1 \leq m \leq k$)对应于函数 $f$ 应用于第 $m$ 个滤波器在输入体积上卷积的和与偏置 $b_m$ 的结果。每个滤波器有 $d_{in}e^2$ 个参数,因此该层总共有 $kd_{in}e^2$ 个参数和 $k$ 个偏置。
以下是一个卷积层的示例:输入体积为 $5 \times 5 \times 3$,零填充 $p = 1$,使用两个 $3 \times 3 \times 3$ 的滤波器(空间范围),步长 $s = 2$
超级会员免费看
订阅专栏 解锁全文
1240

被折叠的 条评论
为什么被折叠?



