2、深度神经网络:模型与方法

深度神经网络:模型与方法

1. 卷积神经网络(CNNs)概述

卷积神经网络(CNNs)专为计算机视觉任务而设计,与常规神经网络在架构上有所不同。其神经元按三维(高度、宽度和深度)排列,以匹配数据(图像可视为像素长方体)的几何形状。在CNN中,空间维度逐层减小,而深度维度增加。

CNN的底层通常是局部连接的,其空间支持(感受野)有限,有助于获取空间局部相关信息,并通过池化操作减小空间维度。当空间维度足够小时,会使用全连接层,最后一层是计算类别分数的全连接层。CNN具有生物学灵感,动物视觉皮层中的细胞仅对全局视野的有限部分敏感。

2. CNN的各层结构
2.1 卷积层

卷积层是CNN架构的核心,对输入图像的空间局部相关性做出反应。它由一组空间大小有限的滤波器组成,滤波器的权重是可训练的。卷积层的名称源于其工作方式:滤波器在整个图像上滑动,就像计算图像与滤波器的卷积一样。滤波器滑动时的移位称为“步长”参数,是深度卷积神经网络的超参数之一。

在每个滤波器位置,会对滤波器和图像中相应区域进行点积运算。所有滤波器在整个图像上滑动完成后,每个滤波器都会得到一个激活图,这些激活图沿深度方向存储,这解释了为什么CNN中深度维度会逐层增加。

实际应用中,CNN学习到的每个滤波器在遇到特定视觉特征时会被激活。随着层数增加,滤波器变得越来越抽象。底层滤波器倾向于对简单对象(如边缘、特定形状或颜色)做出反应,而上层滤波器可以对更复杂的对象(如建筑物、动物等)做出反应,具体取决于训练数据集。

使用CNN可以减少网络的参数(权重)数量。例如,假设每个图像用元素为0或1的矩阵编码,卷积层会学习一组滤波器。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值