深度神经网络:模型与方法
1. 卷积神经网络(CNNs)概述
卷积神经网络(CNNs)专为计算机视觉任务而设计,与常规神经网络在架构上有所不同。其神经元按三维(高度、宽度和深度)排列,以匹配数据(图像可视为像素长方体)的几何形状。在CNN中,空间维度逐层减小,而深度维度增加。
CNN的底层通常是局部连接的,其空间支持(感受野)有限,有助于获取空间局部相关信息,并通过池化操作减小空间维度。当空间维度足够小时,会使用全连接层,最后一层是计算类别分数的全连接层。CNN具有生物学灵感,动物视觉皮层中的细胞仅对全局视野的有限部分敏感。
2. CNN的各层结构
2.1 卷积层
卷积层是CNN架构的核心,对输入图像的空间局部相关性做出反应。它由一组空间大小有限的滤波器组成,滤波器的权重是可训练的。卷积层的名称源于其工作方式:滤波器在整个图像上滑动,就像计算图像与滤波器的卷积一样。滤波器滑动时的移位称为“步长”参数,是深度卷积神经网络的超参数之一。
在每个滤波器位置,会对滤波器和图像中相应区域进行点积运算。所有滤波器在整个图像上滑动完成后,每个滤波器都会得到一个激活图,这些激活图沿深度方向存储,这解释了为什么CNN中深度维度会逐层增加。
实际应用中,CNN学习到的每个滤波器在遇到特定视觉特征时会被激活。随着层数增加,滤波器变得越来越抽象。底层滤波器倾向于对简单对象(如边缘、特定形状或颜色)做出反应,而上层滤波器可以对更复杂的对象(如建筑物、动物等)做出反应,具体取决于训练数据集。
使用CNN可以减少网络的参数(权重)数量。例如,假设每个图像用元素为0或1的矩阵编码,卷积层会学习一组滤波器。
超级会员免费看
订阅专栏 解锁全文
3945

被折叠的 条评论
为什么被折叠?



