图像识别之卷积讲解

最新推荐文章于 2024-10-22 00:47:05 发布

原创最新推荐文章于 2024-10-22 00:47:05 发布 · 3.3k 阅读

CC 4.0 BY-SA版权

8 篇文章

订阅专栏

8 篇文章

订阅专栏

本文详细阐述了卷积的概念，从连续空间的卷积定义出发，解释了卷积如何应用于图像处理中，即通过卷积核对图像进行操作，形成新的图像。讨论了卷积在图像识别中的意义，以及线性系统与卷积的关系，强调了线性移不变系统输出可通过输入与系统线性特征函数的卷积得到。

下面详细说明一下卷积的概念

先来说明一下连续空间的卷积定义

连续空间的卷积定义是f（x）与g（x）的卷积是f（t-x）g（x）在t从负无穷到正无穷的积分值，t-x要在f（x）定义域内，所以看上去很大的积分实际上还是在一定范围内的。

实际的过程就是f（x）先做一个Y轴的反转，然后再沿X轴平移t就是f（t-x），然后再把g（x）拿来，两者乘积低的值再积分，（由于大多数模板都是对称的，所以模板不旋转）想象一下如果g（x）或者f(x)是个单位的阶跃函数，那么就是f（t-x）与g(x)相交部分的面积，这就是卷积了。

关于阶跃函数，参考百度百科

在数学中，如果实数域上的某个函数可以用半开区间上的指示函数的有限次线性组合来表示，那么这个函数就是阶跃函数。阶跃函数是有限段分段常数函数的组合。

阶跃函数是奇异函数，t<0时，函数值为0；t=0时，函数值为1/2,；t>0时，函数值为1[1] 。

按广义函数理论，单位阶跃函数ε(t)的定义为：

即阶跃函数ε(t)作用与检验函数φ(t)的效果是赋予它一个数值，该值等于φ(t)在(0,∞)区间的定积分[1]

把积分符号换成求和就是离散空间的卷积定义了，那么在图像中卷积是什么意思呢，就是图像是f（x），模板g（x)，然后将模板g（x）在模板中移动，每到一个位置，就把f(x)与g（x）的定义域相交的元素进行乘机并且求和，得出新的图像一点，就是被卷积后的图像，模板又称为卷积核，卷积核做一个矩阵的形状。

卷积定义上是现行系统分析经常用到的，线性系统就是一个系统的输入和输出的关系是线性关系，就是说整个系统可以分解成N多的无关独立变化，整个系统就是这些变化的累加。

如 x1->y1, x2->y2; 那么A*x1 + B*x2 -> A*y1 + B*y2,这就是线性系统，表示一个线性系统可以用积分的形式，如Y = Sf(t,x)g(x)dt，S是积分的符号，f（t,x）表示的是A，B之类的线性系数。

看上去很像卷积，如果将f(t,x)=F（t-x）就成为了卷积了，这种变化实际上说明f（t,x）是一个线性移不变，就是说变量的差不变化的时候，那么函数的值不变化，实际上说明线性移不变系统的输出可以通过输入和表示系统线性特征的函数卷积得到。