卷积的简洁解释
定义卷积是因为我们发现:一个系统在x时刻的输出往往不仅仅由x时刻的输入决定,还由x时刻之前甚至x时刻之后的输入决定。我们用g(x)表示时刻x的输入,f(t)表示离某时刻距离为t的的输入对输出的影响,那么系统在x时刻的输出可以表示为:
h(x)=∫−∞+∞f(t)g(x−t) dt
h(x) = \int_{-\infin}^{+\infin} {f(t)g(x - t)} \, {\rm d} t
h(x)=∫−∞+∞f(t)g(x−t)dt
这个式子的意义是:x时刻的输出h(x)是由x时刻前后所有输入g(x - t)的效果叠加得到的,f(t)就表示离某时刻距离t的输入的影响。这个式子就是卷积。此式可以看作f(.)和g(.)的一种复合,g(.)表示输入信号,f(.)刻画周围时刻的影响,记作:
f∘g(x)=∫−∞+∞f(t)g(x−t) dt
f \circ g(x) = \int_{-\infin}^{+\infin} {f(t)g(x - t)} \, {\rm d} t
f∘g(x)=∫−∞+∞f(t)g(x−t)dt
称为函数f与g的卷积。记住这里g是信号,f是“卷积核”。
卷积可以看作滑动平均的推广,可以作为一种信息提取/降噪/降频的手段。
上式是一维连续输入信号的情况,计算机视觉中卷积神经网络(CNN)中的卷积是类似的:这一层位置为 (x, y) 的像素的输出由上一层(x - Δ, y - Δ)的一个小区域作为输入决定的。
图卷积网络(GCN)的卷积也可看作CNN中的卷积的推广。如果我们把像素看作节点,相邻像素之间连上一条边,那么一副图片可以看作一个图,卷积就应用与这幅图上。