在深度学习,尤其是卷积神经网络(CNN)中,卷积、激活、池化和批量归一化是四个基本操作。它们共同作用,帮助模型高效学习和提取数据中的重要特征。
1. 卷积操作
作用
卷积操作旨在通过滑动卷积核(过滤器)在输入数据上提取局部特征,如边缘和角点。
过程
滑动卷积核:卷积核在输入特征图上移动,逐个覆盖区域。
特征计算:在每个位置,卷积核与输入特征图的对应部分进行逐元素相乘并求和,得到输出值。公式为:
h ( i , j ) = ∑ m ∑ n f ( i + m , j + n ) ⋅ g ( m , n ) h(i,j) = \sum_{m} \sum_{n} f(i+m, j+n) \cdot g(m,n) h(i,j)=m∑n∑f(i+m,j+n)⋅g(m,n)
在此公式中, f f f代表输入特征图, g g g 代表卷积核, h h h 为输出特征图。输出特征图的横纵坐标由 i i i 和 j j j表示,而卷积核的横纵坐标则用 m m m 和 n n n 表示。
输出特征图的大小需要满足以下公式:
D o u t = D i n − D c o n v + 2 P S + 1 D_{out}=D_{in}-D_{conv}+2PS+1 Dout=Din−Dconv+2PS+1
D o u t D_{out} Dout表示输出特征图的维度(宽度或高度)。
D i n D_{in} Din表示输入特征图的相应维度大小。
D c o n v D_{conv} Dconv表示卷积核的相应维度大小。
P P P表示边界填充的大小。