【yolov5 trick1】训练阶段和推理阶段图像分辨率的处理方法

最新推荐文章于 2025-10-10 11:59:58 发布

原创

最新推荐文章于 2025-10-10 11:59:58 发布 · 9.8k 阅读

38 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #计算机视觉 #深度学习 #python #机器学习

本文探讨了YoloV5采用的图像分辨率调整技巧，通过将输入图像尺寸调整为32的倍数，显著提高了推理速度。对比了不同输入尺寸对性能的影响，详细解释了训练与推理阶段的图像预处理过程。

首先看github这一段话（链接https://github.com/ultralytics/yolov3/issues/232）：

大致含义：比较yoloV3不同输入图像分辨率的推理时间，输入图像分辨率padded为32倍数的矩形框要比输入图像分辨率为等宽高的正方形框的推理时间提升了0.63倍。yoloV5采用了这一trick。

在常用的目标检测算法中，输入图像的分辨率大小不一，常用的方式是将输入图像的分辨率归一化为统一的图像分辨率，然后再喂给目标检测网络。

若设置喂给目标检测网络输入图像的分辨率为：416*416

目标检测算法训练阶段和推理阶段resize输入图像为416*416，例如原始输入图像为1280*720：

训练阶段的方法是：

原始输入图像宽高比：720/1280 = 0.5625

以长边为基准，缩放比例分别为：1,0.5625

等比例缩放后的分辨率为：416 ，234

训练阶段对等比例缩放后的分辨率进行pading：左右两列的列表分别pad = （416-234）/ 2 = 91，padding后的图像为：

推理阶段：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

机器学习算法那些事

关注关注

7
点赞
踩
38

收藏

觉得还不错? 一键收藏
16
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

YOLOv5的Tricks | 【Trick3】Test Time Augmentation(TTA)

Clichong

06-01

4042

如有错误，恳请指出。一句话简单的介绍就是测试过程中也使用数据增强，官方教程介绍：Test-Time Augmentation (TTA) Tutorial在训练过程中数据增强是非常常用的一种手段，目的是为了提高模型的泛化能力，以免出现大小不一样，图像选择一下就分辨不出来的尴尬。那么TTA就是想在推理阶段也进行数据增强。不过不会太复杂，因为会增加额外的计算量，在打比赛的时候可能会用到，因为打比赛不在意你的推理时长是多久，所以可以尽情瞎造；但是在实际部署的情况下，因为推理速度减慢很可能会达不到实时监测的效果，所

YOLOv5的Tricks | 【Trick14】YOLOv5的val.py脚本的解析

Clichong

08-12

1万+

如有问题，恳请指出。这篇可能是这个系列最后的一篇了，最后把yolov5的验证过程大致的再介绍介绍，基本上把yolov5的全部内容就稍微过了一遍了，也是我自己对这个项目学习的结束。（补充一下，这里我介绍的yolov5-6.0版本的代码）这个脚本主要分为是三个部分：主体代码运行部分 + 指标计算部分 + 绘图部分，这里就主要介绍前两个部分的内容。细节比较多，比上一篇的detect.py脚本复杂很多，这里写得困难逻辑也不会很清晰，简单做个记录，方便日后自己回忆。在训练阶段每个batch训练结束后，都会调用一次va

16 条评论您还未登录，请先登录后发表或查看评论

基于YOLOV5模型的图像识别

jun778895的博客

08-09

1013

YOLOv5是YOLO系列算法的最新版本，它在保持高准确率的同时，进一步提高了检测速度和模型的轻量化。YOLOv5采用CSPDarknet53作为骨干网络，并结合了一系列针对小目标检测的改进策略，如Mosaic数据增强、自适应图片缩放等，使其在复杂场景下的目标检测任务中具有很好的表现。YOLOv5的算法框架通常分为输入端、骨干网络、Neck网络和输出端几个部分。其中，输入端通过Mosaic数据增强和自适应图片缩放方法提高模型的泛化能力；

yolo-windows检测高分辨率图像及封装应用

weixin_34194087的博客

11-19

1246

YOLO训练自己的数据集的一些心得封装yolo-windows为动态链接库 yolo-windows源码项目开源代码：LargeImageDetect-yolo-windows 由于项目需要，需要将yolo移植到windows下并进行封装并自动测试，遇到的主要问题如下： 1.yolo测试的图片一般不会太大，基本为468*468，或者512*512，项目中需要检测的图片分...

一文看懂大模型三个核心阶段：训练（Training）、推理（Inference）和部署（Deployment）

最新发布

2401_84815887的博客

10-10

1032

文章通过"学生成长"类比，生动解释了AI模型从开发到服务的三个核心阶段：训练阶段（如学生备考）通过海量数据学习规律，调整参数；推理阶段（如学生考试）利用训练好的模型对新数据进行预测判断；部署阶段（如学生就业）将模型应用到实际场景，包括云端、边缘设备或混合部署。这种类比方式帮助初学者理解AI模型的完整生命周期和工作原理。

关于Yolov5在测试时，图像大小被调整的问题

iamjingong的博客

06-02

1万+

关于Yolov5在测试时，图像大小被调整的问题

【目标检测】YOLOv5：640与1280分辨率效果对比

兴趣使然的创作者

08-02

2万+

原本是想在VisDrone数据集上进行对比测试，然后当换用更大分辨率之后，即使batch_size减为1，依然面临显存不足的问题。因此我想在自己的电脑上测试一下相同的数据集从640x640到1280x1280效果会有多少提升。YOLOv5-5.0版本的四个预训练权重输入的图片尺寸固定为640x640。末尾带6的预训练权重，这几个权重是在更大分辨率1280x1280进行训练的。从表中可以看出，换用更大尺寸的分辨率之后，mAP指标还是有明显提升的。注自己的数据集样本量不多，并且目标较稀疏，因此mAP比较高。..

u版yolov5输入大小

weixin_41012399的博客

10-22

8453

u版yolov5: 模型的输入设置为（640，640），输入图片上1920*1080： 3x1080x1920 ——等比例缩放—— 3x384x672 ——backbone—— 3x128x48x84和3x256x24x42和3x512x12x21 ——Detect——- transpose 3x48x84x6和3x24x42x6和3x12x21x6 后处理 12096x6和3024x6和756x6 求和得到15876x6 nms 得到目标？x6 再例如768x1024——预处理——480x640 所以ca

vb.net设置分辨率和缩放比例_【yolov5 trick1】训练阶段和推理阶段图像分辨率的处理方法...

weixin_39897449的博客

12-13

773

首先看github这一段话(链接https://github.com/ultralytics/yolov3/issues/232)：大致含义：比较yoloV3不同输入图像分辨率的推理时间，输入图像分辨率padded为32倍数的矩形框要比输入图像分辨率为等宽高的正方形框的推理时间提升了0.63倍。yoloV5采用了这一trick。在常用的目标检测算法中，输入图像的分辨率大小不一，常用的方式...

yolov1-v3学习报告.pdf

03-22

从YOLOv1到YOLOv3的演进中，我们可以看到模型结构的复杂化、预测精确度的提升和训练技巧的精细化。YOLOv1的核心思想是将目标检测作为回归问题处理，但在速度和准确性方面仍有局限。通过YOLOv2的改进，引入新的训练...

使用yolov5实现图像识别

qq_41974199的博客

06-01

6469

非常简单yolov5训练图片识别，都可以去实现的人工智能。如果你不想进行从头训练模型，可以下载这个已经训练好的模型进行上一步的测试模型进行预测。分类模型下载提取码：vvd6。

目标检测数据集(YOLOV5目录格式)：大分辨率水下海鲜动植物目标检测数据集（5类别）

03-21

项目包含：大分辨率水下海鲜动植物目标检测数据集（5类别），数据保存按照YOLOV5文件夹保存，可直接用作目标检测数据集，无需额外处理。图像分辨率为1920*1080的RGB图片，数据为海水中动植物目标【数据集介绍】水下图像数据，5类别：海参、海胆、扇贝、海星、海草五类别【数据总大小】800 MB 数据分为分为训练集和验证集训练集datasets-images-train：6080张图片和6080个标签txt文件组成验证集datasets-images-val：1520张图片和1520个标签txt文件组成测试集datasets-images-val：1200张不带txt标签的图片 ***除此外，包含检测类别的txt字典文件*** 为了方便查看数据，提供了可视化py文件，随机传入一张图片即可绘制边界框，并且保存在当前目录。脚本无需更改，可以直接运行

基于yolov5模型训练之后的图像识别

qq_42368762的博客

02-02

1万+

基于yolov5模型训练之后的图像识别

关于上篇yolov5遇到图片预测尺寸问题

m0_52053298的博客

04-06

1990

上篇遇到的问题在经过多次尝试，进行预测对比之后到的了一个比较好的图片缩放比例以及img-size大小，因为yolov5中img-size的值通常为32的整数倍，于是我就设置值进行预测预测的结果进行对比，发现图片缩放到1024×736的尺寸，img-size设置608的大小得到的预测结果相较于其他的都要好。关于这方面还是要多进行测试对比。

YOLO模型训练及预测

热门推荐

weixin_NineDays66

12-03

2万+

YOLO模型介绍目录 [隐藏] 1简介 2核心思想 3YOLO代价函数 4网络实现 4.1标签定义 4.2网络定义 5网络训练 6网络预测简介 YOLO为一种新的目标检测方法，该方法的特点是实现快速检测的同时还达到较高的准确率。作者将目标检测任务看作目标区域预测和类别预测的回归问题。该方法采用单个神经网络直接预测物品边界和类别概率，实现端到端的物品检测。同时，该方法...

深度学习中训练、推理和验证分别都是什么意思

Env1sage的博客

08-03

7073

训练是深度学习模型的初始阶段，其中模型通过学习数据的过程来逐步优化自己的参数，以便能够捕获输入数据的特征并执行特定任务。在训练阶段，模型接收训练数据集（包括输入特征和相应的标签或目标值），并使用优化算法（如梯度下降）来调整模型参数，以最小化预测值与真实标签之间的差距（损失函数）。训练的目标是使模型能够从数据中学习到一般的模式，以便在以后的推理阶段中进行准确的预测。验证是在训练阶段用于监控模型性能和避免过拟合的过程。在推理阶段，模型接收新的、未见过的数据样本，并根据其已学习到的特征和模式，生成预测结果。

Yolov5修改网络后训练的时候出现尺寸图不匹配

weixin_43446161的博客

01-26

2296

修改test.py中 dataloader = create_dataloader(path, imgsz, batch_size, model.stride.max(), opt, hyp=None, augment=False, cache=False, pad=0, rect=True)[0] 修改pad = 0 就可以了

PyQt6+Yolov5使用过程中出现摄像头图像张量的尺寸不匹配的问题以及解决方案

weixin_63020134的博客

06-14

2167

报错：“RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 76 but got size 75 for tensor number 1 in the list.”YOLOv5支持任意大小的输入尺寸，并且可以通过调整配置文件或代码中的相关参数来设置所需的输入尺寸。但要注意，更大的输入尺寸可能需要更高的计算资源和更长的推理时间。的时候，传递给它的图像张量的尺寸不正确，导致出现维度不匹配的错误。

目标检测 YOLOv5 图像大小与loss权重的关系

二分掌柜的

05-15

1万+

目标检测 YOLOv5 图像大小与loss权重的关系 flyfish 训练图像的大小的参数 parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='[train, test] image sizes') opt = parser.parse_args() 第一个640是训练图像的大小，第二个640是测试图像的大小，两者可以不同。图像大小必须是32的整数倍，检查图像的width和height能否被32

yolov5 trick

08-15

Yolov5是一个目标检测算法，而"trick"一词通常指的是在算法中使用的一些技巧或改进方法。在Yolov5中，有一些常见的技巧可以应用，以提高检测性能或加速算法。这些技巧包括： 1. 数据增强：通过对训练数据进行扩充和变换，如随机裁剪、旋转、缩放等，可以增加数据的多样性，提高模型的鲁棒性和泛化能力。 2. 分类损失加权：在Yolov5中，使用了分类损失加权的方法，对不同大小的目标进行加权处理，以平衡不同目标的重要性。 3. 网络结构改进：Yolov5通过引入CSPDarknet53网络和PANet特征融合模块，对网络结构进行改进，提高了特征提取和表示能力。 4. 多尺度训练：Yolov5采用了多尺度训练的策略，通过在不同尺度下训练模型，可以提高对不同大小目标的检测能力。 5. 模型剪枝压缩：为了减小模型的体积和加速推理速度，可以采用模型剪枝和压缩技术，去除冗余参数和层，以达到模型轻量化的目的。这些技巧只是Yolov5中的一部分，还有其他一些技巧可以根据具体任务和需求进行调整和应用。