
YOLO 目标检测
文章平均质量分 77
简析YOLO-V5源码中每个重要的部分
忆世界
菜菜的带学生
展开
-
【yolo】torchhub的模型部署与使用, 含视频、摄像头处理
Hub是一个简易API和工作流程,为复现研究提供了基本构建模块在项目的根目录下, 实现hubconf.py文件, 这个项目就可以使用pytorch hub进行加载模型我们可以看到, yolov5 下就实现了这个文件我们使用一行代码就可以将模型加载出来对应我们的写法, 调用到了hubconf.py的yolov5s方法我们继续看_create方法去除了无效代码, 我们可以看出, 首先将模型加载成对象, 这也是detect.py中用到的检测模型, 然后, 再封装成AutoShape对象,预检测框生成。原创 2024-07-04 11:25:01 · 1338 阅读 · 0 评论 -
【yolo】图像预处理方法letterbox
letterbox被用于LoadImages类的__next__方法中, 用于输入图像尺寸的预处理。letterbox实现了图像调整技术,主要用于深度学习领域中的物体检测任务,确保不同尺寸的输入图像能被模型接受。Letterbox的原理很简单。当输入图像的纵横比与模型所需不一致时,Letterbox会在图像的顶部和底部添加填充(通常是黑色或与背景色相同),以保持纵横比的一致性。填充的宽度会根据纵横比差异进行调整。这种方法可以确保模型能够处理各种纵横比的图像,并减少因纵横比差异导致的问题。原创 2024-07-02 14:26:41 · 1853 阅读 · 0 评论 -
【yolo】非极大值抑制NMS在yolov5的使用与实现详解,含简单示例与代码解析
🚀交并比(IoU, Intersection over Union)是一种计算不同图像相互重叠比例的算法,经常被用于深度学习领域的目标检测或语义分割任务中。在我们得到模型输出的预测框位置后,也可以计算输出框与真实框(Ground Truth Bound)之间的 IoU,此时,这个框的取值范围为 0~1,0 表示两个框不相交,1 表示两个框正好重合。原创 2024-07-02 09:44:40 · 3162 阅读 · 0 评论 -
【yolo】yolov5 对不同媒体源的处理方式
yolov5 可以处理不同格式的数据, 如图像, 视频, 截屏, 摄像头, 流媒体等等。原创 2024-07-02 17:09:31 · 471 阅读 · 0 评论 -
【yolo】目标检测预测框生成流程浅析, 含示例
首先是配置文件, 我们在配置文件中可以看到这样的配置项关于和可以看这篇文档简单来说, 模型深度系数就是配置文件中模型重复次数∗模型深度系数模型宽度系数就是模型输出维度args的第一个参数∗模型深度系数我们主要关注的是锚点配置项表示三组数据, 分别对应宽高, 是对应特征图缩小 8 倍时对应的参数, 其他类似, 后续我们将提到相关参数的使用方式。原创 2024-06-28 00:13:41 · 1650 阅读 · 0 评论 -
【yolo】关于对scale_boxes方法的讨论
scale_boxes 方法可以将被压缩的图像上的预检测框映射到原图上, 方法定义如下。不太懂这里的含义, 我的想法是这样的, 即将检测框坐标映射到没有灰边的压缩图上。这里有一个问题 , 就是当图像大小不符合32的倍数, 需要使用灰边填充时。现在我们需要将y坐标4 和 8 映射到没有灰边的压缩图上, 可以得到公式。, 映射到结果的含义就是检测框下移了。一点简单草稿, 即灰边在y轴上。, 压缩后有值的y轴范围是。,但是在特征图上的处理则是。测试后和原来的方式差距不大…这里计算出灰边的长度。原创 2024-07-04 16:11:45 · 501 阅读 · 0 评论 -
【yolo】YOLO-V5 损失函数源码解析
然后,将Ground True 的真实检测框预处理成需要的格式,注意,这里真实检测框需要根据anchor的类型,判断这个样本是正样本还是负样本,所以说我们在训练时anchor的预设值是很重要的!yolov5 的损失函数主要是分为三个部分,分别是分类损失、定位损失、置信度损失。最后,分别进行定位损失,置信度损失,分类损失计算。首先, 初始化BCELoss函数。最后相加,得到最终结果。原创 2024-08-12 11:13:02 · 484 阅读 · 0 评论