卷积神经网络及其进展:概述与应用
1. 引言
如今,深度学习正成为研究人员关注的领域。作为神经网络的代表,卷积神经网络(CNN)表现出色,在深度学习中取得了显著成果。“卷积”一词最早由LeCun等人提出,他们将CNN用于手写邮政编码识别,这便是著名的CNN模型LeNet - 5的首个版本。
随后,CNN的不同组件得到了诸多改进。与传统模型相比,CNN具有重要特性:一是通过权重共享减少训练参数数量,提高泛化能力;二是特征提取和分类阶段均采用学习过程;三是相较于其他人工神经网络模型,CNN更易于实现大型网络;四是当输入经过更深层时,CNN能够获取抽象特征。由于这些特性,CNN广泛应用于计算机视觉、自然语言处理、语音处理和放射学等多个领域。
2. 卷积神经网络的元素
2.1 初步数学概念
- 向量和张量 :向量用$X_D$表示具有$D$个元素的列向量,矩阵用大写字母$X$表示,$X_{H×W}$表示由$H$行$W$列组成的矩阵。高阶矩阵称为张量,如$X_{H×W×D}$表示三阶张量,其每个元素由三元组$(i, j, d)$索引,其中$0 ≤ i ≤ H$,$0 ≤ j ≤ W$,$0 ≤ d ≤ D$。在CNN中,所有输入、参数和中间表示都以张量形式存在。可以使用“vec”符号将张量转换为向量,例如:
A =
3 5
4 6
vec(A) = (3, 4, 5, 6)^T
对于三阶矩阵,可通过递归过程将其向量化为二阶矩阵,再转换为一阶矩阵(即向量),此过程同样适用于四
超级会员免费看
订阅专栏 解锁全文

806

被折叠的 条评论
为什么被折叠?



