卷积网络:原理、应用与发展
1. 卷积网络概述
卷积网络,也被称为卷积神经网络(CNNs),是一种专门用于处理具有已知网格状拓扑结构数据的神经网络。常见的数据类型包括时间序列数据(可看作一维网格,按规则时间间隔采样)和图像数据(可看作二维像素网格)。卷积网络在实际应用中取得了巨大成功,其名称源于网络中使用的卷积这一数学运算,卷积是一种特殊的线性运算,卷积网络至少在一层中使用卷积代替了一般的矩阵乘法。
2. 卷积操作
2.1 卷积的定义
在最一般的形式中,卷积是对两个实值参数函数的操作。以跟踪宇宙飞船位置为例,激光传感器提供飞船在时间 $t$ 的位置 $x(t)$,但传感器有噪声,为获得更准确的位置估计,我们使用加权函数 $w(a)$ 对多个测量值进行加权平均,其中 $a$ 是测量值的时间间隔。这样得到的新函数 $s(t)$ 为:
[s(t) = \int x(a) w(t - a) da]
这个操作就是卷积,通常用星号表示:$s(t) = (x * w)(t)$。
2.2 离散卷积
在实际计算机处理中,时间通常是离散的。假设激光传感器每秒提供一次测量值,时间索引 $t$ 只能取整数值,此时离散卷积定义为:
[s(t) = (x * w)(t) = \sum_{a = -\infty}^{\infty} x(a) w(t - a)]
2.3 多维卷积
在机器学习中,输入通常是多维数据数组(张量),卷积也常应用于多个轴。例如,对于二维图像 $I$ 和二维核 $K$,卷积输出 $S$ 为:
[S(i, j) = (I * K)(i,
超级会员免费看
订阅专栏 解锁全文
1190

被折叠的 条评论
为什么被折叠?



