这学期选了赵万磊老师的课,感觉很多干货,在这里记录一下。
图片基础
在我们的日常生活中,80%的信息来自视觉,小孔成像是目前相机的基础,小孔成像为什么管用呢,因为光线是散射的,通过一个小的缝隙之后,每个点只有一个方向的光线通过并投影到幕布上,胶片是吸收光的,当它吸收这个方向来的光之后,就会呈现图形,若像下图,所有的光都混杂到一起,自然得到的胶片是灰色的。
这里提到的小孔就是我们现在相机的光圈,那我们相机里还有棱镜,棱镜是干嘛的呢。如下图,这个棱镜可以将一个点发出来各个方向的点集中在幕布上的一个点,也就是幕布上收到的光线越多,图片也就更加清晰。由下图可以总结出,光圈越大景深越浅,光圈越小,看景深越深。
上图就是拿掉透镜后的效果。
焦距大,小光圈,景深深。
图片滤波
图片在计算机中储存使用矩阵方式,所以作为矩阵数据,就可以对他进行操作:
1、二维的傅里叶变换和DCT
2、图片卷积
图片是用0-255表示的,灰度图只有一个通道,彩色图片有三个通道RGB,每个通道都是从0-255.
知道图片在计算机中使用矩阵存储之后,我们就可以对他们进行线性变换和SVD分解。因为图片是多参数函数,所以我们可以做以下操作:
1、傅里叶变换;
2、泰勒展开;
3、找极大极小值。
傅里叶变换
以上是傅里叶分解的例子,傅里叶就是将某个函数用sin和cos表示,但是为什么这样展开是可行的呢,因为cosx和sinx是正交的,所以我们可以认为cosx和sinx组成了一个新的空间,变换后的结果不会有重叠向量。
由以上公式可以看到,傅里叶变换之后有两种参数,一个是每个项的系数,一个是每个项的角度,那么这两个参数哪个更重要呢,下面做了一个实验。
右边生成的结果更像豹子,所以我们可以总结角度携带的信息更多。
高斯卷积
高斯卷积就是用一个高斯核,在原图上不断移动,计算核扫过的框中的值。tip:使用一个5×5的核卷积和先用15的核扫,再用51的核扫,结果是一样的,但是可以节省时间。
DOG的计算:用不同方差的高斯核扫描原图,然后将相邻的两层相减,得到的结果就是DOG:
而DOG一般是图片中的一些边缘,但是看上图得到的边缘还是很宽,所以使用非最大值抑制后得到的边缘就比较清晰了,而且只剩下边缘。
图片几何变换
图片的几何变换包括以下几种:
1、平移
2、旋转
3、缩放
4、仿射变换(以上几种的结合)
图像镜面变换: