深度学习图像预处理保持原尺寸比例

深度学习图像预处理：保持尺寸比例的填充技术

最新推荐文章于 2025-06-15 23:00:27 发布

原创

最新推荐文章于 2025-06-15 23:00:27 发布 · 2.1k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉 #深度学习

在深度学习中，当预训练模型的输入尺寸与实际图像不符时，需要进行图像填充以保持比例。本文介绍了使用CV2和PIL库实现保持原图像比例的填充方法，确保填充部分的网络输入值为0。预处理步骤包括将图像归一化到(-1, 1)区间，并进行相应填充。" 127743693,13980606,Squid代理服务器配置及缓存原理,"['前端', '缓存', '服务器']

在迁移学习的时候，如果pre-trained model的输入图像比例与我们需要输入的图像比例相差加大时就需要对原图像进行padding操作。
关键思想：保持现有图像数据的尺寸比例不变，对其余部分按照网路输入预处理格式进行填充，使得此paddig部分对应网络输入0。

比如，原图像除以255，减0.5，乘以2，即映射到（-1，1）区间的预处理操作，我们能就需要填充int(256/2)左右的值，使得网络对应的输入数值为0。

CV2实现

import cv2
import numpy as np

def image_preporcess(image, target_size):

    # resize 尺寸
    ih, iw = target_size
    # 原始图片尺寸
    h,  w, _ = image.shape

    # 计算缩放后图片尺寸
    scale = min(iw/w, ih/h)
    nw, nh = int(scale * w), int(scale