Open CV系列学习笔记（十四）图像金字塔 2021-02-09

最新推荐文章于 2024-09-17 19:06:08 发布

原创最新推荐文章于 2024-09-17 19:06:08 发布 · 304 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉 #opencv #机器学习 #python

opencv学习笔记系列专栏收录该内容

27 篇文章

订阅专栏

本文介绍图像金字塔的概念及其在计算机视觉中的应用。详细解释了如何通过逐步降低分辨率来创建图像金字塔，并提供了高斯金字塔和拉普拉斯金字塔的具体实现代码。

Open CV系列学习笔记（十四）图像金字塔

图像金字塔

图像金字塔是图像多尺度表达的一种，是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，且来源于同一张原始图的图像集合。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔，层级越高，则图像越小，分辨率越低。
如上述定义所说，一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似。当向金字塔的上层移动时，尺寸和分辨率就降低。因为基础级J的尺寸是2^J*2J或NN（J=log2N)，所以中间级j的尺寸是2^j*2j，其中0<=j<=J。完整的金字塔由J+1个分辨率级组成，由2^J*2J到2^0*20，但大部分金字塔只有P+1级，其中j=J-P，…，J-2，J-1，J，且1<=P<=J。也就是说通常限制它们只使用P级来减少原始图像近似值的尺寸。例如，一幅512512图像的1*1或单像素近似值将非常小。右图显示了一个建立图像金字塔的简单系统。j-1级的近似输出用来建立近似值金字塔，包括原始图像的一个或多个近似值。作为金字塔的原始图像和它的P级减少的分辨率近似都能直接获取并调整。j级的预测残差输出用于建立预测残差金字塔。这些金字塔包括了原始图像的J-P级低分辨率的近似信息，以及建立P级较高分辨率的近似信息。j级的信息在相应近似金字塔的j级近似与基于j-1级预测残差得到的近似估计之间是不同的。对这些差异进行编码（用于存储或传输）将比对近似值进行编码有效得多。
在这里插入图片描述

高斯金字塔

代码：

def pyramid_demo(image):#高斯金字塔
    level = 3
    temp = image.copy()
    pyramid_images = []
    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        cv.imshow("pyramid_down_"+str(i),dst)
        temp = dst.copy()
    return pyramid_images

结果：
在这里插入图片描述

拉普拉斯金字塔

代码：

def lapalian_demo(image):#拉普拉斯金字塔（坑：必须用2的n次方大小的图片）
    pyramid_images = pyramid_demo(image)
    level = len(pyramid_images)
    for i in range(level-1, -1, -1):
        if (i-1) < 0 :
            expand = cv.pyrUp(pyramid_images[i], dstsize=image.shape[:2])
            lpls = cv.subtract(image, expand)
            cv.imshow("lapalian_down_" + str(i), lpls)
        else:
            expand = cv.pyrUp(pyramid_images[i], dstsize=pyramid_images[i-1].shape[:2])
            lpls = cv.subtract(pyramid_images[i-1], expand)
            cv.imshow("lapalian_down_"+str(i), lpls)

结果：
在这里插入图片描述
完整代码：

import cv2 as cv
import numpy as np


def pyramid_demo(image):#高斯金字塔
    level = 3
    temp = image.copy()
    pyramid_images = []
    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        cv.imshow("pyramid_down_"+str(i),dst)
        temp = dst.copy()
    return pyramid_images


def lapalian_demo(image):#拉普拉斯金字塔（坑：必须用2的n次方大小的图片）
    pyramid_images = pyramid_demo(image)
    level = len(pyramid_images)
    for i in range(level-1, -1, -1):
        if (i-1) < 0 :
            expand = cv.pyrUp(pyramid_images[i], dstsize=image.shape[:2])
            lpls = cv.subtract(image, expand)
            cv.imshow("lapalian_down_" + str(i), lpls)
        else:
            expand = cv.pyrUp(pyramid_images[i], dstsize=pyramid_images[i-1].shape[:2])
            lpls = cv.subtract(pyramid_images[i-1], expand)
            cv.imshow("lapalian_down_"+str(i), lpls)


print("--------HEllow Python-------")
src = cv.imread("E:/picture/03.jpg")
cv.namedWindow("input image",cv.WINDOW_AUTOSIZE)
cv.imshow("input image",src)
lapalian_demo(src)
cv.waitKey(0)


cv.destroyAllWindows()