【深度学习基础】互相关与卷积的本质区别及在深度学习中的应用

原创于 2025-12-29 16:19:20 发布 · 543 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

深度学习专栏收录该内容

5 篇文章

订阅专栏

在卷积神经网络（CNN）中，我们经常使用卷积操作来提取图像特征。但严格来说，深度学习框架中实际执行的往往是互相关操作。本文将详细剖析互相关和卷积的数学本质与区别，并说明为什么在深度学习中这两者几乎可以互换。

在这里插入图片描述

一、互相关（Cross-correlation）

互相关是一种在两个信号之间寻找相似性的操作。

对于图像而言，可以理解为：将一个卷积核（filter）在图像上滑动，并在每个局部区域与卷积核做点积，提取特征。

1.1 二维互相关公式

给定图像输入 $X∈RM×N\mathbf{X} \in \mathbb{R}^{M\times N}$ ，卷积核 $W∈RU×V\mathbf{W} \in \mathbb{R}^{U\times V}$ ，互相关运算定义为：
$y_{ij}=\sum_{u=1}^U \sum_{v=1}^V w_{uv} \cdot x_{i+u-1,j+v-1}$
其中， $y_{ij}$ 表示输出特征图在位置 $(i, j)$ 的值。

1.2 示例

假设输入数组为：
$\mathbf{X} = \begin{bmatrix} 0 & 1 & 2 \\ 3 & 4 & 5 \\ 6 & 7 & 8 \end{bmatrix},\quad \mathbf{W} = \begin{bmatrix} 0 & 1 \\ 2 & 3 \end{bmatrix}$
互相关第一个输出元素计算如下：
$0\times0 + 1\times1 + 3\times2 + 4\times3 = 19$
在互相关运算过程中，卷积窗口从输入数组的左上方开始，按从左往右、从上到下的顺序滑动，每次滑动都会将窗口中的输入子数组与核数组按元素相乘再求和，得到输出数组中相应位置的元素。依次计算每个位置的输出，得到完整的输出矩阵。

在这里插入图片描述

二、卷积（Convolution）

卷积与互相关的公式几乎一样，但有一个关键区别：卷积会在滑动之前将卷积核进行水平和垂直翻转。

数学表示为：

$y_{ij} = \sum_{u=1}^U \sum_{v=1}^V w_{uv} \cdot x_{i-u+1, j-v+1}$

当卷积核旋转180°时，原本位于左上角的元素 $w_{11}$ 会对应输入局部区域的右下角元素 $x_{i-1+1, j-1+1} = x_{i,j}$ 。

或者更直观地表示为：
$\mathbf{Y} = \mathbf{W} * \mathbf{X} = \text{rot180}(\mathbf{W}) \otimes \mathbf{X}$
其中，rot180(W) 表示将卷积核旋转180度。

三、互相关与卷积的关系

特性	互相关	卷积
核是否翻转	否	是（水平+垂直）
计算方式	滑动窗口逐元素相乘求和	滑动窗口逐元素相乘求和（核先翻转）
特征提取能力	不受翻转影响	不受翻转影响
深度学习中使用	实际使用	常用名称