用最近邻插值(Nearest Neighbor interpolation)进行图片缩放

原创已于 2022-08-06 10:44:25 修改 · 置顶 · 4.1k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#python #算法 #机器学习

于 2021-09-05 09:16:34 首次发布

嵌入式系统同时被 3 个专栏收录

354 篇文章

订阅专栏

Linux

217 篇文章

订阅专栏

数学

154 篇文章

订阅专栏

本文介绍了最近邻插值（Nearest Neighbor interpolation）算法用于图像缩放的基本原理和Python实现。该算法通过找到新像素位置最近的原像素值来填充，适合快速简单的图像缩放。在放大过程中可能会产生锯齿，但在一定比例内能保持较好的图像质量。文章还提及了双线性内插法作为对比，并提到了在darknet框架中采用的双线性内插值缩放算法。

图片缩放的两种常见算法：

最近邻域内插法(Nearest Neighbor interpolation)
双向性内插法(bilinear interpolation)

本文主要讲述最近邻插值(Nearest Neighbor interpolation算法的原理以及python实现

基本原理

最简单的图像缩放算法就是最近邻插值。顾名思义，就是将目标图像各点的像素值设为源图像中与其最近的点。算法优点在与简单、速度快。

如下图所示，一个4*4的图片缩放为8*8的图片。步骤：

生成一张空白的8*8的图片，然后在缩放位置填充原始图片值(可以这么理解)
在图片的未填充区域(黑色部分)，填充为原有图片最近的位置的像素值。

实现算法：

新图像是原图像的线性映射。

设新图像的坐标为 $P_x,P_y$ ,原图像坐标为 $p_x,p_y$ ，则像素的映射关系是：

$p_x =\frac{W_{old}}{W_{new}}P_x = \frac{W_{old}}{W_{new}}P_x + 0 \cdot P_y$

$p_y=\frac{H_{old}}{H_{new}}P_y=0\cdot P_x + \frac{H_{old}}{H_{new}}P_y$

转换为矩阵形式为：

$\begin{bmatrix} p_x\\ p_y \end{bmatrix} = \begin{bmatrix}\frac{W_{old}}{W_{new}} & 0\\ 0 & \frac{H_{old}}{H_{new}}\end{bmatrix}\begin{bmatrix} P_x\\ P_y \end{bmatrix}$

所以，最近邻域内插法进行图像缩放，本质上是一种线性变换,既然是线性的，变换就是一次的，变换矩阵如上。

那么目标图像中的像素点( $P_x,P_y$ )，对应原图像的像素点 $p_x,p_y$ ，要取整。

实现代码：

import cv2
import numpy as np

def nearest_neighbor_resize(img, new_w, new_h):
    # height and width of the input img
    h, w = img.shape[0], img.shape[1]
    # new image with rgb channel
    ret_img = np.zeros(shape=(new_h, new_w, 3), dtype='uint8')
    # scale factor
    s_h, s_c = (h * 1.0) / new_h, (w * 1.0) / new_w

    # insert pixel to the new img
    for i in range(new_h):
        for j in range(new_w):
            p_x = int(j * s_c)
            p_y = int(i * s_h)

            ret_img[i, j] = img[p_y, p_x]

    return ret_img

img_path = './dice.jpg'
img = cv2.imread(img_path)

#ret_img = nearest_neighbor_resize(img, 222, 220)
ret_img = nearest_neighbor_resize(img, 640, 480)

cv2.imshow("source image", img)
cv2.imshow("after bilinear image", ret_img)
cv2.waitKey()
cv2.destroyAllWindows()

将一个96*96的图像经过算法转换，变成了一张640*480的图像。