CV基础——图像插值

图像插值

    图像插值是图像处理领域比较热门的话题。其目的在于利用已知邻近像素点的灰度值。预估未知像素点的灰度值。从而把一副低分辨率的图像变成相应高分辨率版本以改善图像的视觉效果。

图像插值算法分类

    其中,图像插值算法主要分为两类:

  1. 线性图像插值方法
      常见的有最近邻插值双线性插值以及双三次插值等等。

  2. 非线性图像插值方法
     
     
     

在这里插入图片描述
 
 
 

线性图像插值方法

 

最近邻插值法

    最近邻插值算法,又称零阶插值。它是一种比较容易实现,且算法复杂度较低的插值算法。其原是取代插值点周围四个相邻像素点中欧式距离最短的一个邻点的灰度值作为该点的灰度值。此算法由于仅用对插值点影响最大的(即最近的)像素的灰度值作为该点的值。
 
 
图像实现:
当我们插入一个为点 P P P,矩阵 Q 11 , Q 21 , Q 12 , Q 22 Q_{11},Q_{21},Q_{12},Q_{22} Q11,Q21,Q12,Q22可等分切为四块
显而易见,其中点 P P P Q 11 Q_{11} Q11点的欧式距离最短,此时 P P P点的图像灰度值等于 Q 11 Q_{11} Q11点的灰度值
在这里插入图片描述
 
 
 
 
如下图所示,将一幅 3 ∗ 3 3*3 33的图像放大到 4 ∗ 4 4*4 44,用 f ( x , y ) f(x, y) f(x,y)表示目标图像, h ( x , y ) h(x, y) h(x,y)表示原图像,我们有如下公式:
f ( d s t X , d s t Y ) = h ( d s t X s r c W i d t h d s t W i d t h , d s t Y s r c H e i g h t d s t H e i g h t ) \begin{array}{c} f(dst_{X}, dst_{Y}) = h(\frac{dst_{X}src_{Width}} {dst_{Width}}, \frac{dst_{Y}src_{Height}} {dst_{Height}}) \end{array} f(dstX,dstY)=h(dstWidthdstXsrcWidth,dstHeightdstYsrcHeight)
f ( 0 , 0 ) = h ( 0 , 0 ) f(0,0)=h(0,0) f(0,0)=h(0,0) f ( 0 , 1 ) = h ( 0 , 0.75 ) = h ( 0 , 1 ) f(0,1)=h(0,0.75)=h(0,1) f(0,1)=h(0,0.75)=h(0,1) f ( 0 , 2 ) = h ( 0 , 1.50 ) = h ( 0 , 2 ) f(0,2)=h(0,1.50)=h(0,2) f(0,2)=h(0,1.50)=h(0,2) f ( 0 , 3 ) = h ( 0 , 2.25 ) = h ( 0 , 2 ) f(0,3)=h(0,2.25)=h(0,2) f(0,3)=h(0,2.25)=h(0,2)以此类推计算得 4 ∗ 4 4*4 44的图像
在这里插入图片描述

最近邻插值缺点

    此算法由于仅用考虑最近的像素插值,没有考虑其他相邻像素的影响,因此插值后得到的图像。容易产生块效应,造成图像模糊,放大效果一般不够理想。

    
    

双线性插值算法

    为了改善最近邻插值算法的不足,提出了一种新的插值方法。即双线性插值算法。双线性插值又称一阶插值。其插值原理是。待插点像素值取原图像中与其相邻的四个像素值的水平、垂直两个方向上的线性内插。即根据待采样点与周围四个邻点的距离。确定相应的权重,从而计算出待采样点的像素值。会产生许多新的像素值,它们主要有插值点周围像素的灰度值通过插值运算获得。

    在深度学习模型的upsample上采样模块中,常用的就是BiLinear双线性插值
    

线性插值

    先了解一下基础的线性插值
在这里插入图片描述
已知点 ( x 0 , y 0 ) , ( x 1 , y 1 ) (x_0,y_0),(x_1,y_1) (x0,y0),(x1,y1)求取插值点 x x x处的 y y y,推导如下: y − y 0 x − x 0 = y 1 − y 0 x 1 − x 0 \frac{y-y_0}{x-x_0}=\frac{y_1-y_0}{x_1-x_0} xx0yy0=x1x0y1y0
由于 x x x值已知,可得: y = y 0 + ( x − x 0 ) y 1 − y 0 x 1 − x 0 = x 1 − x x 1 − x 0 y 0 + x − x 0 x 1 − x 0 y 1 y=y_0+(x-x_0)\frac{y_1-y_0}{x_1-x_0}=\frac{x_1-x}{x_1-x_0}y_0+\frac{x-x_0}{x_1-x_0}y_1 y=y0+(xx0)x1x0y1y0=x1x0x1xy0+x1x0xx0y1
假如已知 y y y x x x也是以上相同的推导过程。

    

双线性插值

在这里插入图片描述
已知 Q 12 , Q 22 , Q 11 , Q 21 Q_{12},Q_{22},Q_{11},Q_{21} Q12Q22Q11Q21四个点的值,求 P P P点值。
    
双线性插值求解过程:
        首先在 Q 11 Q 21 、 Q 12 Q 22 Q_{11}Q_{21}、Q_{12}Q_{22} Q11Q21Q12Q22方向上进行两次线性插值,得到 R 1 、 R 2 R_1、R_2 R1R2;然后在 R 1 R 2 R_1R_2 R1R2方向再做一次线性插值,得到 P P P点。这就是双线性插值。

        假如我们定义一个函数 f ( x , y ) f(x,y) f(x,y),且 Q 11 Q 21 、 Q 12 Q 22 Q_{11}Q_{21}、Q_{12}Q_{22} Q11Q21Q12Q22都在该函数上,此时我们求解 P P P f ( x , y ) f(x,y) f(x,y)的值呢?

如上述的双线性插值求解: f ( R 1 ) = x 2 − x x 2 − x 1 f ( Q 11 ) + x − x 1 x 2 − x 1 f ( Q 11 ) f(R_1)=\frac{x_2-x}{x_2-x_1}f(Q_{11})+\frac{x-x_1}{x_2-x_1}f(Q_{11}) f(R1)=x2x1x2xf(Q11)+x2x1xx1f(Q11) f ( R 2 ) = x 2 − x x 2 − x 1 f ( Q 12 ) + x − x 1 x 2 − x 1 f ( Q 22 ) f(R_2)=\frac{x_2-x}{x_2-x_1}f(Q_{12})+\frac{x-x_1}{x_2-x_1}f(Q_{22}) f(R2)=x2x1x2xf(Q12)+x2x1xx1f(Q22) f ( P ) = y 2 − y y 2 − y 1 f ( R 1 ) + y − y 1 y 2 − y 1 f ( R 2 ) f(P)=\frac{y_2-y}{y_2-y_1}f(R_1)+\frac{y-y_1}{y_2-y_1}f(R_2) f(P)=y2y1y2yf(R1)+y2y1yy1f(R2)
最后即 f ( x , y ) f(x,y) f(x,y) f ( x , y ) = f ( Q 11 ) ( x 2 − x 1 ) ( y 2 − y 1 ) ( x 2 − x ) ( y 2 − y ) + f ( Q 21 ) ( x 2 − x 1 ) ( y 2 − y 1 ) ( x − x 1 ) ( y 2 − y ) + f ( Q 12 ) ( x 2 − x 1 ) ( y 2 − y 1 ) ( x 2 − x ) ( y − y 1 ) + f ( Q 22 ) ( x 2 − x 1 ) ( y 2 − y 1 ) ( x − x 1 ) ( y − y 1 ) f(x,y)=\frac{f(Q_{11})}{(x_2-x_1)(y_2-y_1)}(x_2-x)(y_2-y)+\frac{f(Q_{21})}{(x_2-x_1)(y_2-y_1)}(x-x_1)(y_2-y)+\frac{f(Q_{12})}{(x_2-x_1)(y_2-y_1)}(x_2-x)(y-y_1)+\frac{f(Q_{22})}{(x_2-x_1)(y_2-y_1)}(x-x_1)(y-y_1) f(x,y)=(x2x1)(y2y1)f(Q11)(x2x)(y2y)+(x2x1)(y2y1)f(Q21)(xx1)(y2y)+(x2x1)(y2y1)f(Q12)(x2x)(yy1)+(x2x1)(y2y1)f(Q22)(xx1)(yy1)

双线性插值缺点

    经过此算法处理后的图像会产生许多新像素值。他们主要由插值点周围像素的灰度值通过插值运算获得。由于此算法没有考虑相邻点的灰度值变化率的影响。因此具有低通滤波器性质。会使放大后图像的重要细节受到损失。图像变得模糊不清。

 
 
 

向前映射与向后映射

我们知道,通常情况下,一个整数位置 ( x , y ) (x,y) (x,y)经过图像变换后,往往都位于非整数位置。此时就要采用插值技术。此时对于向前映射和向后映射,需要采取不同的策略。

向前映射

可以将几何运算想象成一次一个象素地转移到输出图象中。如果一个输入象素被映射到四个输出象素之间的位置,则其灰度值就按插值算法在4个输出象素之间进行分配,这些分配而来的像素值叠加,就是输出图像整数点位置的像素值称为向前映射法,或象素移交影射。

在这里插入图片描述
向前映射中每个输出像素灰度值需要经过多次运算

向后映射

向后映射法(或象素填充算法)是输出象素一次一个地映射回到输入象素中,以便确定其灰度级。如果一个输出象素被映射到4个输入象素之间,则其灰度值插值决定,然后再遍历输出图像,经过坐标变换、插值两步操作,我们就能将其像素值一个个地计算出来,向后空间变换是向前变换的逆
注:从结果图象的坐标计算原图象的坐标

在这里插入图片描述
向后映射中每个输出像素灰度值只需要经过一次运算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值