卷积神经网络全解析:从基础到实战应用
1. 卷积层的全面描述
卷积层是卷积神经网络的核心组件之一,它接收一个输入体积,该输入体积具有以下特征:
- 宽度 ( w_{in} )
- 高度 ( h_{in} )
- 深度 ( d_{in} )
- 零填充 ( p )
这个输入体积会被 ( k ) 个滤波器处理,这些滤波器代表了卷积网络中的权重和连接。滤波器有几个超参数:
- 空间范围 ( e ),等于滤波器的高度和宽度。
- 步长 ( s ),即滤波器在输入体积上连续应用的距离。当步长为 1 时,就是上一节描述的全卷积。
- 偏置 ( b ),这是一个像滤波器中的值一样需要学习的参数,会被加到卷积的每个分量上。
经过处理后,会得到一个输出体积,其特征如下:
- 激活函数 ( f ),应用于输出体积中每个神经元的输入对数,以确定其最终值。
- 宽度 ( w_{out} = \frac{w_{in} - e + 2p}{s} + 1 )
- 高度 ( h_{out} = \frac{h_{in} - e + 2p}{s} + 1 )
- 深度 ( d_{out} = k )
输出体积的第 ( m ) 个“深度切片”(( 1 \leq m \leq k ))对应于激活函数 ( f ) 应用于第 ( m ) 个滤波器在输入体积上卷积的和加上偏置 ( b_m )。每个滤波器有 ( d_{in}e^2 ) 个参数,因此该层总共有 ( kd_{in}e^2 ) 个参数和 ( k ) 个偏置。
一般来说,建议使用小尺寸的滤波器(如 3x3 或 5x5)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



