YOLO中letterbox_image相关解释

最新推荐文章于 2024-07-04 13:35:11 发布

原创最新推荐文章于 2024-07-04 13:35:11 发布 · 2.8k 阅读

6 ·

CC 4.0 BY-SA版权

深度学习专栏收录该内容

7 篇文章

订阅专栏

本文介绍使用PyTorch实现YOLO目标检测模型时如何调整输入图像尺寸，以确保其符合模型所需的固定尺寸要求，例如416×416。通过保持纵横比不变的方式缩放图像，并使用灰度填充剩余部分。

部署运行你感兴趣的模型镜像

pytorch实现YOLO中对输入图像尺寸进行调整，满足输入的尺寸要求，比如412*412或者320*320

def letterbox_image(img, inp_dim):
    """
    lteerbox_image()将图片按照纵横比进行缩放，将空白部分用(128,128,128)填充,使图像尺寸满足输入要求
    具体操作就是,某个边正好可以等于目标长度,另一边小于等于目标长度
    将缩放后的数据拷贝到画布中心，即可完成输入变换
    """
    img_w, img_h = img.shape[1], img.shape[0]
    w, h = inp_dim#inp_dim是需要resize的尺寸（如416*416）
    # 取min(w/img_w, h/img_h)这个比例来缩放，缩放后的尺寸为new_w, new_h,即保证较长的边缩放后正好等于目标长度(需要的尺寸)，另一边的尺寸缩放后还没有填充满.
    new_w = int(img_w * min(w/img_w, h/img_h))
    new_h = int(img_h * min(w/img_w, h/img_h))
    resized_image = cv2.resize(img, (new_w,new_h), interpolation = cv2.INTER_CUBIC) #将图片按照纵横比不变来缩放为new_w x new_h，768 x 576的图片缩放成416x312.,用了双三次插值
    # 创建一个画布, 将resized_image数据拷贝到画布中心。
    canvas = np.full((inp_dim[1], inp_dim[0], 3), 128)#生成一个我们最终需要的图片尺寸hxwx3的array,这里生成416x416x3的array,每个元素值为128
    # 将wxhx3的array中对应new_wxnew_hx3的部分(这两个部分的中心应该对齐)赋值为刚刚由原图缩放得到的数组,得到最终缩放后图片
    canvas[(h-new_h)//2:(h-new_h)//2 + new_h,(w-new_w)//2:(w-new_w)//2 + new_w,  :] = resized_image
    
    return canvas

您可能感兴趣的与本文相关的镜像