图像金字塔
图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效单概念简单的结构。
金字塔的底部是待处理图像的高分辨率表示,而顶部是以低分辨率的近似。将一层一层的图像比喻成金字塔,层级越高,图像越小,分辨率越低。
常见的图像金字塔主要有两种,分别是:
- 高斯金字塔:用来向下采样,是主要的图像金字塔。
- 拉普拉斯金字塔:用来从金字塔底层图像重建上层未采样的图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用。
两者的主要区别在于:高斯金字塔用来向下采样图像,拉普拉斯金字塔用来从金字塔底层图像向上采样,重建一个图像。
要从金字塔的第i层生成第i+1层,先要用高斯核对第i层进行卷积,然后删除所有的偶数行和偶数列,新得到的图像的面积就是源图像的四分之一,按照上述过程就可以得到整个金字塔。
高斯金字塔
高斯金字塔是通过高斯平滑和亚采样获得一系列下采样图像,也就是说第K层高斯金字塔通过平滑与亚采样可以获得第K+1层高斯图像。高斯金字塔包含了一系列低通滤波器,其截止频率从上一层以因子2逐渐增加,所以高斯金字塔可以跨越很大的频率范围。
对图像进行下采样
为获得层级位i+1的金字塔图像,我们采用如下方法:
- 对第i层图像进行高斯内核卷积。
- 将所有的偶数行和列去除。
得到的即为第i+1层的图像。显而易见,得到的图像只有原图的四分之一。通过不停的迭代就可以得到整个金字塔,同时也会丢失图像的信息。
对图像进行上采样
如果想放大图像,则需要通过向上取样操作得到,具体为:
- 将图像的每个方向扩大为原来的两倍,新增的行和列以0填充。
- 使用先前同样的内核与放大后的图像卷积,得到新增像素的近似值。
得到的图像即为放大后的图像,但是与原图相比会比较模糊,因为在缩放的过层中丢失了图像信息。如果想在缩小和放大整个过程中减少信息的丢失,这些数据就形成了拉普拉斯金字塔。