四、卷积神经网路 (Convolutional networks (CNN))

最新推荐文章于 2025-06-05 20:51:59 发布

原创

最新推荐文章于 2025-06-05 20:51:59 发布 · 877 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

本文详细介绍了卷积神经网络（CNN）的核心概念，包括卷积操作、动机（稀疏交互、参数共享、等变表示）、池化以及卷积函数的变体。CNN在图像处理中广泛应用，通过卷积层、池化层提取特征，实现对输入数据的高效表示和处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积神经网路

1、卷积操作
2、动机（motivation）
3、池化（pooling）
4、基本卷积函数的变体
5、结构化输出

简单来说，卷积神经网路是神经网路至少有一层的矩阵乘操作替换 卷积操作（convolution）。

1、卷积操作

卷积操作常见表示形式是两个实值函数之间的操作。下面以一个简单的问题解释卷积操作。

假设我们使用激光传感器来追踪一个飞船的位置，由此得到飞船位置关于时间的函数 $x (t)$ 。并且传感器工作在有噪声的环境里，为了降低噪声的影响，我们将采取加权平均来给予最近测量更大的权重。假设权重函数为 $w (a)$ ，其中 $a$ 是测量发生的时间。我们得到以下公式来预测飞船位置， $s(t)=\int x(a)w(t-a)\,da$ 上述即为卷积操作，卷积操作可以有 $*$ 表示，则有 $s (t) = (x * w) (t)$ 。且在本例中 $w$ 应为概率密度函数。在卷积神经网路中， $x$ 函数为输入， $w$ 为 kernal。

在实际问题中，激光传感器的时间是离散的，例如 1 秒一次采样。那么有离散形式的卷积操作， $s(t)=(x*w)(t)=\sum _{a=-\infin}^{+\infin}x(a)w(t-a)$ 在机器学习问题中，输入常是多维的。下面给出卷积操作的二维形式， $S(i,j)=({I*K})(i,j)\sum_m \sum_n I(m,n)K(i-m,j-n)$ 卷积操作是交换，这意味着上式等价于， $S(i,j)=({K*I})(i,j)\sum_m \sum_n I(i-m,j-n)K(m,n)$