
2D目标检测
文章平均质量分 81
THE@JOKER
一个无耻混蛋
展开
-
yolov8 onnx 推理
【代码】yolov8 onnx 推理。原创 2024-05-30 11:28:45 · 198 阅读 · 0 评论 -
yolov3(ultralytics yaml版) pytorch->onnx->ncnn
此命令将预训练的 YOLOv3模型(默认yolov3.pt,或者yolov3-tiny.pt)导出为 ONNX、TorchScript 和 CoreML 格式。python models/export.py --weights weights/yolov3.pt --img 640 --batch 1输出:3 个导出的模型(yolov3.mlmodel , yolov3.onnx , yolov3.torchscript.pt)将与原始 PyTorch 模型一起保存推荐使用Netron View原创 2021-10-19 10:53:37 · 818 阅读 · 0 评论 -
yolov3(ultralytics cfg旧版) 代码详解
YOLOv3.cfg文件解析[net]#Testing#batch=1#subdivisions=1# 在测试的时候,设置 batch=1,subdivisions=1#Trainingbatch=16subdivisions=4# 这里的 batch 与普遍意义上的 batch 不是一致的。# 训练的过程中将一次性加载 16 张图片进内存,然后分 4 次完成前向传播,每次 4 张。# 经过 16 张图片的前向传播以后,进行一次反向传播。width=416height=416原创 2021-08-07 21:10:10 · 1710 阅读 · 2 评论 -
yolov3(ultralytics cfg版-v5-v8 / yml版v9) 训练、检测、可视化
https://github.com/ultralytics/yolov3YOLOv5GPU 速度使用批大小为 32 的 V100 GPU 测量每张图像的端到端时间平均超过 5000 张 COCO val2017 图像,包括图像预处理、PyTorch FP16 推理、后处理和 NMS。EfficientDet 数据来自google/automl,批量大小为 8。重现通过python test.py --task study --data coco.yaml --iou 0.7 --weig原创 2021-08-07 15:57:16 · 6959 阅读 · 0 评论 -
YOLOv5(ultralytics) 检测火焰
请参考:YOLOv5(ultralytics) 训练自己的数据集,VOC2007为例Fire Dataset:https://github.com/OlafenwaMoses/FireNET/releases/download/v1.0/fire-dataset.zip将数据下载在yolov5/my_data文件夹下,进行文件夹合并,弄成如下:1、ImageSets/Main文件夹下生成train.txt,val.txt,test.txt和trainval.txt四个文件(存放图片名字):my原创 2021-08-02 16:28:24 · 1766 阅读 · 5 评论 -
YOLOv5(ultralytics) 训练自己的数据集,VOC2007为例
官方教程:https://github.com/ultralytics/yolov5/wiki/Train-Custom-DataVOC格式数据1.在yolov5目录下创建VOC2007文件夹,有VOC2007 …Annotations # 存放图片对应的xml文件 …JPEGImages # 存放图片 …ImageSets/Main #之后会在Main文件夹内自动生成train.txt,val.txt,test.txt和trainval.txt四个文件,存放训练集、验证集、测试集图片的名原创 2021-08-02 14:43:28 · 4868 阅读 · 12 评论 -
快速入门 YOLOv5(ultralytics)
YOLOv5 是一系列在 COCO 数据集上预训练的对象检测架构和模型,代表Ultralytics 对未来视觉 AI 方法的开源研究,结合了在数千小时的研究和开发中获得的经验教训和最佳实践。https://github.com/OlafenwaMoses/FireNET/releases/download/v1.0/fire-dataset.zip文档有关训练、测试和部署的完整文档,请参阅YOLOv5 文档。快速入门示例安装Python>=3.6.0需要安装所有 requirement原创 2021-08-02 14:42:37 · 7856 阅读 · 0 评论 -
旷视开源YOLOX
导读YOLO系列终于又回到了Anchor-free的怀抱,不用费劲心思去设计anchor了!旷视开源新的高性能检测器YOLOX,本文将近两年来目标检测领域的各个角度的优秀进展与YOLO进行了巧妙地集成组合,性能大幅提升。《YOLOX: Exceeding YOLO Series in 2021》paper: https://arxiv.org/abs/2107.08430code: https://github.com/Megvii-BaseDetection/YOLOX本文是旷视科技在目标检转载 2021-07-22 22:18:30 · 374 阅读 · 0 评论 -
YOLOv5 学习笔记
文章目录简介YOLOv5网络架构YOLOv5基础组件输入端BackboneNeckHead输出端Yolov5四种网络结构的不同点四种结构的参数Yolov5网络结构简介YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。主要的改进思路如下所示:输入端:在模型训练阶段,提出了一些改进思路,主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;基准网络:融合其它检测算法中的一些新思路,主要包括:Focus结构与CSP结构转载 2021-06-22 21:15:45 · 5749 阅读 · 0 评论 -
CornerNet 学习笔记
《CornerNet: Detecting Objects as Paired Keypoints》ECCV 2018将对象检测为成对的关键点论文链接:https://arxiv.org/abs/1808.01244代码链接: https://github.com/umich-vl/CornerNet摘要将目标检测问题当作关键点检测问题来解决,也就是通过检测目标框的左上角和右下角两个关键点得到预测框,因此CornerNet算法中没有anchor的概念,这种做法在目标检测领域是比较创新的而且能够取原创 2021-06-21 23:25:22 · 296 阅读 · 0 评论 -
YOLOv3-SPP 学习笔记
YOLO3各个版本对比首先来看下官方给的在COCO数据集上的表现,可以看到SPP版本相对于前面几个版本,mAP有了好几个百分点的提升,在加了SPP模块之后的YOLOv3为何有这么大的提升?YOLOv3和YOLOv3-spp网络结构对比YOLOv3网络结构图:YOLOv3-spp网络结构图:SPP模块结构如下图:相对于普通版本的YOLOv3,SPP版本在第五、六层卷积之间增加了一个SPP模块,这个模块主要是由不同的池化操作组成,具体的实现在YOLOv3-SPP的cfg文件中:为什么会得原创 2021-06-19 17:12:53 · 1308 阅读 · 0 评论 -
RetinaNet 学习笔记
RetinaNet算法源自《Focal Loss for Dense Object Detection》ICCV 2017摘要该论文最大的贡献在于提出了Focal Loss用于解决one-stage算法中正负样本的比例严重失衡问题,从而创造了RetinaNet(One Stage目标检测算法)这个精度超越经典Two Stage的Faster-RCNN的目标检测网络。作者的基础网络使用的是Resnet,然后在不同尺度的feature map建立金字塔,也就是FPN网络,这样就获得了丰富且多尺度的卷积特原创 2021-06-18 22:41:29 · 805 阅读 · 1 评论 -
PANet 学习笔记
PANet是18年的一篇CVPR,作者来自港中文,北大,商汤与腾讯优图,PANET可看作Mask-RCNN+,是在Mask-RCNN基础上做的几处改进。Introduce解决问题:当前实例分割最佳模型Mask-RCNN的信息传播还不够充分,低层级的特征对于大型实例识别很有用, 最高层级特征和较低层级特征之间的路径长每个建议区域都是基于 从一个特征层级池化 得到的 特征网格而预测的,此分配是启发式的。由于其它层级的丢弃信息可能对于最终的预测还有用,这个流程还有进一步优化的空间mask 预测仅在单个原创 2021-06-18 20:57:06 · 964 阅读 · 0 评论 -
FPN(特征图金字塔)
《Feature Pyramid Networks for Object Detectin》CVPR2017通常,利用网络对物体进行检测时,浅层网络分辨率高,学到的是图片的细节特征,深层网络,分辨率低,学到的更多的是语义特征。1)、通常的CNN使用如下图中显示的网络,使用最后一层特征图进行预测例如VGG16,feat_stride=16,表示若原图大小是1000x600,经过网络后最深一层的特征图大小是60x40,可理解为特征图上一像素点映射原图中一个16x16的区域;那这个是不是就表示,如果原图中原创 2021-06-17 22:43:01 · 1005 阅读 · 0 评论 -
几种数据增强的比较
论文地址:https://arxiv.org/abs/1905.04899v21.几种数据增强的区别Mixup:将随机的两张样本按比例混合,分类的结果按比例分配;Cutout:随机的将样本中的部分区域cut掉,并且填充0像素值,分类的结果不变;CutMix:就是将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值,分类结果按一定的比例分配Mosaic:这种数据增强方式简单来说就是把4张图片,通过随机缩放、随机裁减、随机排布的方式进行拼接区别上述三种数据增强的区别:原创 2021-06-17 22:02:11 · 2267 阅读 · 7 评论 -
YOLOv4 补充
考虑到很多同学GPU显卡数量并不是很多,Yolov4对训练时的输入端进行改进,使得训练在单张GPU上也能有不错的成绩。比如数据增强Mosaic、cmBN、SAT自对抗训练。但感觉cmBN和SAT影响并不是很大,所以这里主要讲解Mosaic数据增强。Mosaic数据增强Yolov4中使用的Mosaic是参考2019年底提出的CutMix数据增强的方式,但CutMix只使用了两张图片进行拼接,而Mosaic数据增强则采用了4张图片,随机缩放、随机裁剪、随机排布的方式进行拼接。这里首先要了解为什么要进.转载 2021-06-17 21:18:40 · 631 阅读 · 0 评论 -
SSD-pytorch复现笔记1
代码:https://github.com/amdegroot/ssd.pytorch复现的过程按照github的步骤进行即可。下载数据由于我之前下载过voc0712、coco的数据,不需要再运行sh下载,按照sh指示建立相关文件夹。将sh所需下载的文件放进去,并将3个sh文件部分代码进行注释:再运行sh,对文件进行操作即可。训练之前,需要修改代码1、在multibox_loss.py中调换97,98两行,改成如下:loss_c = loss_c.view(num, -1) # The li原创 2020-12-28 14:42:44 · 439 阅读 · 0 评论 -
FasterRCNN学习笔记
Faster RCNN可以分为4个主要内容:1、Conv layers。特征提取网络Backbone。Faster RCNN首先使用一组基础conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和RoI pooling层。2、Region Proposal Networks。RPN网络用于生成proposals(建议框)。该层通过softmax判断anchors(先验框)属于positive或者negative,利用boun..原创 2021-01-15 19:38:05 · 1715 阅读 · 2 评论 -
YOLOv1 学习笔记
这个大佬写的很好: YOLO v1深入理解总的损失函数:转载 2021-01-20 22:28:06 · 826 阅读 · 0 评论 -
YOLOv2 / YOLO9000学习笔记
YOLOv2相对v1版本,在继续保持处理速度的基础上,从预测更准确(Better),速度更快(Faster),识别对象更多(Stronger)这三个方面进行了改进。其中识别更多对象也就是扩展到能够检测9000种不同对象,称之为YOLO9000。预测更准确(Better)论文[1]中给出了下面的改进项目列表,列出各项改进对mAP的提升效果。1)batch normalization(批归一化)批归一化使mAP有2.4的提升。批归一化有助于解决反向传播过程中的梯度消失和梯度爆炸问题,降低对一些超参数(转载 2021-06-17 17:54:11 · 327 阅读 · 0 评论 -
YOLOv3 学习笔记
YOLOv1:YOLO v1深入理解YOLOv2:YOLOv2 / YOLO9000 深入理解转载 2021-01-21 13:36:21 · 425 阅读 · 0 评论 -
YOLOv3 cfg配置文件解析
[net] ★ [xxx]开始的行表示网络的一层,其后的内容为该层的参数配置,[net]为特殊的层,配置整个网络# Testing ★ 测试模式 #号开头的行为注释行,在解析cfg的文件时会忽略该行# batch=1# subdivisions=1# Training ★ 训练模式 每次前向图片的数目=batch/subdivisionsbatch=64原创 2021-01-24 14:20:40 · 485 阅读 · 0 评论 -
SSD 学习笔记
SSD github : https://github.com/weiliu89/caffe/tree/ssdSSD paper : https://arxiv.org/abs/1512.02325SSD 动态PPT: https://docs.google.com/presentation/d/1rtfeV_VmdGdZD5ObVVpPDPIODSDxKnFSU0bsN_rgZXc/pub?start=false&loop=false&delayms=3000&slide=id转载 2021-03-30 22:17:29 · 1323 阅读 · 0 评论 -
CenterNet :Objects as Points 学习笔记
https://blog.youkuaiyun.com/c20081052/article/details/89358658https://www.jianshu.com/p/0ef56b59b9achttps://blog.youkuaiyun.com/weixin_38715903/article/details/98039181原创 2021-05-16 14:56:37 · 138 阅读 · 0 评论 -
Mask R-CNN 学习笔记
《Mask R-CNN》ICCV2017论文链接:https://arxiv.org/abs/1703.06870官方代码链接:https://github.com/facebookresearch/Detectron摘要Mask R-CNN是ICCV2017的best paper,在一个网络中同时做目标检测(object detection)和实例分割(instance segmentation)。该算法在单GPU上的运行速度差不多是5 fps。Mask RCNN沿用了Faster RCNN的思想转载 2021-06-15 15:20:17 · 459 阅读 · 0 评论 -
YOLOv4 学习笔记
《YOLOv4: Optimal Speed and Accuracy of Object Detection》2020论文原文:https://arxiv.org/abs/2004.10934源码:https://github.com/AlexeyAB/darknet摘要有很多特征可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些特征的组合进行实际测试,并需要对结果进行理论证明。某些特征仅在某些模型上运行,并且仅在某些问题上运行,或者仅在小型数据集上运行;而某些特征(例如批归一化和残原创 2021-06-16 22:45:20 · 778 阅读 · 1 评论