一、图像工程基础
1.卷积
对图像的识别或者是分类需要提取图像中的某些特征,卷积可以完成工作。例如在一张灰度图像中每个像素都是一个数字。方便说明,可以简化为6*6的数值阵列,如下:
提取其特征则需要一个filter,这里可以是一个3*3的数值阵列。如果想提取其边缘特征,可以使用下面的filter:
而卷积运算则是在6*6中选取3*3大小的阵列与filter对应的数字相乘后相加得到一个值。
如果从6*6的左上角遍历到右下角便可得到一个新的4*4的阵列。
======>
2.填充
在上述运算过程中,原来的6*6中边上的数字参与运算的次数会比中间的数字少,会造成图像边缘数据信息丢失。而且在某些时候并不希望图像像素越来越少(6*6 --> 4*4)。所以在原6*6的基础上再上下左右再填充一列,使其拓展成8*8,经过3*3的filter的卷积形成6*6的结果。
3.卷积步长
上述卷积默认使用的步长为1,即蓝色部分向右和向下只移动一格。在某些情况下,步长可以指定为其他值。步长也会影响结果的大小和运算成本。
一般的,n*n 的原始数据,使用 f*f 大小的filter,填充为 p,步长为 s,则结果大小为