作为基础学习,建议先看一看电子版的:
[美] Michael Nielsen著,Xiaohu Zhu/Freeman Zhang译:《神经⽹络与深度学习》(Neural Networks and Deep Learning)
这本书深入浅出,把神经网络的基本原理讲得比较清楚。
人们把feature map翻译成特征图,把channel翻译为通道。有时这二者说的是同一件事;但有时强调输入输出时就叫通道,强调图片经过神经网络运算后发现的特征就叫特征图。在下文的说明过程中,我们不做显著的区分,同学们可以理解为上一层输出的feature maps就是下一层输入的channels。
(1)卷积核/过滤器
卷积核也称为过滤器(filter)。
卷积核的长、宽都是人为指定的,长X宽也被称为卷积核的尺寸,常用的尺寸为3X3,5X5等。
在指定卷积核时,只需指定其长和宽两个参数,这是因为通常卷积核的深度(也可以理解为通道数)与当前图像的深度(feather map的个数,比如:RGB三个通道就是三个feature map)相同。
卷积过程中,输入层有多少个通道(输入的feature map个数),滤波器就要有多少个通道(卷积核的深度);但是滤波器的数量是任意的,滤波器的数量决定了卷积后输