
目标检测
文章平均质量分 80
所向披靡的张大刀
这个作者很懒,什么都没留下…
展开
-
【yolov7系列三】实战从0构建训练自己的数据集
大家好,我是张大刀。上文中提到了yolov7的正负样本匹配策略,这里主要从0开始训练自己的数据集。首先大刀是在windows电脑端完成数据集的标注,linux ubuntu系统中完成模型的训练。对windows系统电脑无要求,训练的电脑最好有gpu(没有gpu在cpu下也能训练,就是速度感人)默认大家已经有conda的环境,如果没有的话,请参考)......原创 2022-08-08 20:01:57 · 2447 阅读 · 1 评论 -
【yolov7系列二】正负样本分配策略
细节剖析yolov7正负样本匹配策略,并于yolov5 v6对比。原创 2022-07-25 11:41:22 · 6417 阅读 · 4 评论 -
【yolov6系列一】深度解析网络架构
在yolov5霸屏计算机视觉领域很久时,六月处美团开源了yolov6,并号称在精度和速度上均超越其他同量级的计算机视觉模型,刚刚瞅了一眼,star已经超过2.8k。网上基于yolov6的解读有很多,文末会附上美团的官方解读和开源代码的github链接。文本开始yolov6系列,先和大家分享下整个yolov6的网络架构(基于tag0.1版本的yolov6s),后续再基于各个模块根据自己的理解分享给大家。.........原创 2022-07-06 11:10:51 · 13763 阅读 · 8 评论 -
项目实战工具|目标检测评价map精细化系列工具
更多内容关注公众号“张大刀”大家好,我是张大刀,前两天写完目标检测的评价标准map后,有人在后台私信我如果map只能对目标检测大概评价,那具体到具体项目,真的要每次自己去将检测结果过一遍,人为去发现漏检和误检的数据特征吗?额,作为人工智能当然不允许这样的事情发生。想起来之前在公众号中写到的TIDE模块,开始以为是某one的实用模块,后来才发现原来大佬是发了ECCV2020,孤陋寡闻了。。立马拜读下。这一拜读后,竟然发现很多惊喜。对于目标检测,常见使用map做为评价指标,详情可以看《【小白入坑篇】目标原创 2022-04-28 14:55:24 · 1185 阅读 · 1 评论 -
从零开始手把手搭建Vision Transformers(tensorflow版本)
导言Vision Transformers (ViT)在2020年Dosovitskiy et. al.提出后,在计算机视觉领域逐渐占领主导位置,在图像分类以及目标检测、语义分割等下游任务中获得了很好的性能,掀起transformer系列在CV领域的浪潮。这里将介绍如何从头开始基于tensorflow 框架一步步实现ViT模型。前言上一篇我们写了基于pytorch版本实现ViT模型,感兴趣点击这里,应大家要求,今天将实战如何从头开始实现我的第一个 ViT(使用 tensorflow版本),如果你还没有原创 2022-04-19 10:52:28 · 4790 阅读 · 5 评论 -
从零开始手把手搭建Vision Transformers(Pytorch版本)
更多内容关注公众号“所向披靡的张大刀”导言Vision Transformers (ViT)在2020年Dosovitskiy et. al.提出后,在计算机视觉领域逐渐占领主导位置,在图像分类以及目标检测、语义分割等下游任务中获得了很好的性能,掀起transformer系列在CV领域的浪潮。这里将介绍如何从头开始基于Pytorch 框架一步步实现ViT模型。前言如果你还没有熟悉自然语言处理(NLP)中使用的Transformer模型,可能会对transformer在CV领域的应用有点懵圈,对ViT原创 2022-04-19 10:02:32 · 5471 阅读 · 4 评论 -
目标检测 YOLOv5 - YOLOv5:v6版本多机多卡训练出现的错误及解决方案
2021年4月份发布的 YOLOv5:v5版本,2021年10月份发布的 YOLOv5:v6版本发布了更小的Nano模型YOLOv5n和YOLOv5n6一. 改进的方面整合了 Roboflow,使用Roboflow来组织、标注、准备、版本化和托管用于训练YOLOv5模型的数据集,Roboflow上有很多公开的数据集。二. 当采用多机多卡训练时,出现了以下问题TypeError: barrier() got an unexpected keyword argument ‘device_ids’代原创 2022-04-13 10:58:15 · 3633 阅读 · 6 评论 -
深度学习入坑篇-池化及numpy实现
前言 卷积神经网络(ConvNets或CNNs)作为一类神经网络,托起cv的发展,本文主要介绍卷积神经网络的另外一个操作——池化操作,其原理,并以小白视角,完成池化从0到1的numpy实现。1 作为小白入坑篇系列,开始今天的算子池化,错过其他算子的请关注公众号所向披靡的张大刀后台领取。 池化一词开始视觉机制,指的是资源的合并、整合,英文为pooling,中文直译过来即为池化。池化操作(也称为子采样或下采样)主要为了降低每个特征图的维数,可以减少参数矩阵的尺寸,从而减少最原创 2022-03-19 21:26:59 · 2990 阅读 · 0 评论 -
深度学习入坑篇-卷积及numpy实现
前言 卷积神经网络(ConvNets或CNNs)作为一类神经网络,托起cv的发展,本文主要介绍卷积神经网络的灵魂——卷积操作,其原理,并以小白视角,完成卷积从0到1的numpy实现。1 卷积神经网络(ConvNets或CNNs)作为人工智能的入门神经网络,已被广泛用于图像识别和分类等领域。除了为机器人和自动驾驶汽车提供视觉之外,ConvNets 在识别人脸、物体和交通标志方面也应用广泛。其中卷积操作作为cnn的灵魂,其出现加快了人工智能的发展。 卷积一词一开始出现在数学中,为了表示一个函数对原创 2022-03-17 23:05:17 · 3847 阅读 · 0 评论 -
评价目标检测的方法map 新方法 TIDE
导语一般来说,物体检测一般使用map来评价目标检测的检测效果,如果检测效果不好时,我们需要深入了解如何哪些数据检测效果不好,如何调试模型的性能以及如何优化它获得更好的性能。这时一个好的开源库 TIDE 则可以准确实现对象检测,对于提高物体检测的模型的准确性有很大指导方向。01目标检测评价标准map在目标检测中,评价模型好坏主要有两个关键方面:速度和准确性,一般的模型会在两者之间权衡,这里我们主要专注于分析模型的准确性。简而言之,目标检测预测一张图片中对象的类别、位置以及置信度。因此检测对象是由三原创 2022-03-13 22:09:10 · 6838 阅读 · 2 评论 -
【yolov5 6.0 源码解析】---utils /datasets.py
yolov5中数据读取并转换成训练格式主要涉及到四点:数据读取cache缓存数据增强与label对应其他一些辅助函数class LoadImagesAndLabels(Dataset)class LoadImagesAndLabels(Dataset): # YOLOv5 train_loader/val_loader, loads images and labels for training and validation cache_version = 0.5 # da原创 2021-12-29 11:22:52 · 5973 阅读 · 3 评论 -
【yolov5 6.0 源码解析】---utils /augmentations.py
yolov5 数据增强代码主要有以下几种方式:class Albumentations # 数据增强package,比pytorch 自带的transform 更丰富def augment_hsv(im, hgain=0.5, sgain=0.5, vgain=0.5) # 图像增强方式,hgain 是色调,不同色调不同颜色,sgain是饱和度, vgain是亮度def hist_equalize(im, clahe=True, bgr=False):# 采用自适应直方图均衡化做图像增强def r原创 2021-12-22 18:07:32 · 5598 阅读 · 1 评论 -
yolov5 提速多GPU训练显存低的问题
yolov5多GPU训练显存低修改前:按照配置,在train.py配置如下:运行 python train.py 后nvidia-smi 显示显存占用如下:修改后参考yolov5 官方中的issue中,有人提到的分布式多进程的方法:在yolov5运行的虚拟环境下,找到torch的distributed 的环境:比如我的在conda3/envs/rcnn/lib/python3.6/site-packages/torch/distributed/;在distributed文件下,新建多进程的原创 2021-11-11 14:33:57 · 11477 阅读 · 7 评论