yolov5学习记录
把学习Yolov5过程中的一些难点记录下来。
又又土
兴趣是最好的老师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
labelme的json转mask,实测有效
3、你需要在标注文件夹下用txt写下以下代码,并保存bat文件。2、转到你的标注文件夹(包括json和图片)1、创建一个conda的虚拟环境。4、在终端这么输入就可以了。放在最后一个就可以了。原创 2024-01-06 13:22:42 · 1796 阅读 · 0 评论 -
yolov5分割模型容易出错的点。
出现dataset not find要注意yaml文件中的路径是否错误。比如val在路径中要写成valid。这是我觉得很扯淡的地方val:让我写成了val: ./dataset1/val/images,然后就一直报错找不到数据集。用lableme标注之后上传到roboflow生成数据集,并导出yolov5格式。当然也可以在roboflow上标注。,然而分割用到的是yolov5s-seg.pt。还有要在import库之后加上。模型选择也要注意,条件反射选择。要在main函数的第一行加上。原创 2023-12-29 09:43:29 · 503 阅读 · 0 评论 -
标注图片和未标注图片混合在一起训练而导致的精度下降,召回率高但精度低的解决办法?
【代码】标注图片和未标注图片混合在一起训练而导致的精度下降,召回率高但精度低的解决办法?原创 2023-12-22 16:27:01 · 476 阅读 · 0 评论 -
大图像中的小目标检测——基于YOLOV8+OnnxRuntime部署+滑动窗口+Zbar的条码检测研究
最近项目中用到了条码检测,查阅很多资料,说用Zbar等工具检测的比较多。但是我们会发现,检测是不稳定的,Zbar是解析条码的工具包,运用好它的前提是:能够准确将条码区域提取出来,以及图像质量(分辨率、打光效果等)要把握很好。本文基于YOLOV8+OnnxRuntime部署+滑动窗口+Zbar对于条码检测进行升级,可以有效解决条码检测问题,并且速度也很高。市面上有很多条码、二维码检测的算法,最让人印象深刻的就是腾讯微信扫码——基于SSD和超分算法的二维码检测方式。原创 2025-05-22 13:13:52 · 1016 阅读 · 0 评论 -
(以YOLO标注为例)labelimg标注闪退的几种情况详解,报错IndexError: list index out of range
**方法一**:正常一张一张标注,标注完成之后另存一份classes.txt文件。如果打卡发现了classes.txt有误,将正确的复制回来即可。 - **方法二**:在第一张中标注所有类别,保存好第一张图片和对应的classes.txt。这样就是从一开始就确定**类别、顺序**。这也是实现**多人同时标注**,并且标注文件一致的有效手段。原创 2023-09-15 09:18:40 · 32164 阅读 · 23 评论 -
Yolov5通俗易懂网络结构详解
三个输出层对应三个不同的分辨率。高分辨率层可以检测小目标,低分辨率层可以检测大目标。看完上面,再看YOLOV5的原来的PANet结构应该很清楚了。提取好特征之后需要进一步提取特征。方法的演变过程,由易到难。1、第一种基础结构就是在最终层进行预测处理。2、第二种是先建立图片金字塔再进行预测处理。4、将高层特征和低层特征融合后进行预测。3、第三种是每一层卷积之后都进行预测。b、是PANet双向融合金字塔。a、是FPN单向融合金字塔。原创 2023-09-27 11:31:21 · 5065 阅读 · 3 评论 -
yolov5.7输入图像切片,推理之后采用拼接处理
最近在使用yolov5检测大图像中的小缺陷的时候,发现采用主流的sahi等的处理方式,会让推理速度变得很慢。C++重写python逻辑开发周期又太长。所以尝试自己写一下图像切片,将大图像分割成小图像未入网络。原创 2023-09-26 15:03:38 · 1650 阅读 · 4 评论 -
把相机采集的图片转为yolov5的输入图片
【代码】把采集的相机图片转为yolov5的输入图片。原创 2023-09-15 09:45:47 · 439 阅读 · 0 评论 -
yolov5导出onnx文件
首先打开conda终端。原创 2023-09-15 09:40:47 · 637 阅读 · 0 评论 -
YOLOV5的stride为32,这对输入图片尺寸有什么影响?
2、假设输入的图片为641*641(原本应是640*640),那么数学上将图片下采样32倍得到的为20.03*20.03,但在显示世界中不存在0.3个像素点(1、yolov5的stride为32指的是输出层的feature map是由输入图片缩放32倍得到的。),因此需要输入图片必须是32的倍数,确保最后一层的feature map大小为:整数*整数。这个地方该怎么描述?原创 2023-09-14 21:38:38 · 1664 阅读 · 5 评论 -
未经过极大值抑制,yolov5输出的torch.size([1,18900,85])代表什么?
1、未经过MNS最大值抑制的预测结果会产生[1,18900,85]的输出结果。18900代表画出的检测框的个数,85代表coco数据集的80个类别概率、4个坐标值 、1个总体置信度信息。2、YOLOv5的总体置信度为输出每个边界框所预测物体的对象概率(probability)和分类置信度(confidence)的乘积。原创 2023-09-14 21:43:39 · 502 阅读 · 1 评论 -
pred = non_max_suppression(pred....)极大值抑制做了什么?
3、如果[1,5,6]中的6输出的数值为[672,395,810,878,0.98,0];前四个坐标、第5个为置信度、第六个0在coco数据集中表示人。2、经过极大值抑制之后输出为[1,5,6],表示检测除了5个框,6代表前4个值为坐标值、第5个为置信度信息、第6个值为所属的类别。1、没有经过最大值抑制的输出为输出为torch.size([1,18900,85]),输出了18900的框所以需要过滤。原创 2023-09-14 21:50:08 · 2557 阅读 · 1 评论
分享