
视觉
文章平均质量分 86
CV相关
理心炼丹
只争朝夕
展开
-
【论文阅读】SCRFD: Sample and Computation 重分配的高效人脸检测
尽管在 非受控(uncontrolled)人脸检测 方面已经取得了巨大的进展,但低计算成本和高精度的 高效人脸检测仍然是一个公开的挑战。本文指出训练数据采样和计算分布策略(training data sampling and computation distribution strategies)是高效准确的人脸检测的关键。原创 2023-02-21 17:47:47 · 1424 阅读 · 4 评论 -
MMPose 实践笔记
mmpose 实践原创 2022-12-08 18:37:44 · 1312 阅读 · 1 评论 -
萌娃人脸生成器 实践踩坑笔记
本文是运行一个StyleGAN训练出的萌娃人脸生成器。原创 2022-10-26 18:08:23 · 580 阅读 · 0 评论 -
YOLOX 学习笔记
YOLO 系列高性能:速度快,精度高,方便部署(工业界)。YOLO系列发展至今主要包含了v1、v2、v3、v4和v5以及针对每个版本的改进系列。YOLOv1源于Joseph Redmon,主要贡献在于:开发出实时高性能目标检测的one-stage检测框架,只需要将图像一次性输入到网络中即可预测出图像中目标的位置,具有速度快;检测精度高和方便部署等优点。原创 2022-10-15 19:33:09 · 4150 阅读 · 0 评论 -
目标检测标签分配之 OTA 和 SimOTA 细节学习
一张图片上有3个目标框,即3个ground truth项目有2个检测类别,比如 cat/dog网络输出1000个预测框,其中只有少部分是正样本,绝大多数是负样本是候选检测框的信息,维度是[1000,4]。预测框的四个坐标。obj_preds是目标分数(object score),维度是[1000,1]。预测框是前景还是背景。cls_preds是类别分数,维度是[1000,2]。预测框的2个检测类别的one-hot。训练网络需要知道这 1000个预测框的标签,而如何分配标签呢?原创 2022-10-12 10:59:28 · 4976 阅读 · 1 评论 -
Retinaface ONNX 如何正确导出
Retinaface 是一个人脸检测器,人脸检测天生存在强先验知识,比如近场人脸识别,人脸较大,监控视角下人脸识别通常人脸较小,两者天生对输入的分辨率有个假设,如果人脸很大,不需要大的分辨率,提升速度。人脸小,希望提高 Recall 那么需要大的分辨率。Retinaface 在不同分辨率下怎么做这件事情。怎么通过 这个仓库的方案解决该问题。直接执行 convert_to_onnx.py。原创 2022-09-05 16:42:38 · 552 阅读 · 0 评论 -
研究会2022.07.22--对比学习
对比学习原创 2022-07-22 18:17:33 · 784 阅读 · 0 评论 -
【论文阅读】YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
在 5 FPS 到 160 FPS 的范围内,YOLOv7 在 speed 和accuracy 上都超过了所有已知的目标检测器,并且在 GPU V100上 30 FPS 或更高的实时目标检测器中,YOLOv7 有最高的 56.8% AP的accuracy。YOLOv7-E6 目标检测器( 56FPS V100,55.9%AP) 比基于 transformer 的检测器 SWINL Cascade-MASK R-CNN(9.2 FPS A100,53.9%AP) 的 speed ............原创 2022-07-16 17:19:42 · 4761 阅读 · 0 评论 -
【人脸识别】ArcFace: Additive Angular Margin Loss for Deep Face Recognition
利用深度卷积神经网络(DCNNs)进行大规模人脸识别的特征学习的主要挑战之一是设计适当的损失函数来增强识别能力。Centre loss 惩罚 深度特征与其对应的类中心在欧氏空间的距离,以实现类内紧致。SphereFace 假设最后一个全连接层中的线性变换矩阵可以用作角空间中的类中心的表示,并以乘法的方式惩罚深度特征与其相应权值之间的角度。最近,一个流行的研究方向是,将 margins 纳入成熟的损失函数,以最大限度地提高类别可分离性。本文提出了一种基于Additive Angular ......原创 2022-07-13 13:09:21 · 1595 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5 Multi-GPU 训练
📚本指南解释了如何正确地 在一个或者多个机器上 使用 多gpu 在一个数据集上训练训练YOLOv5🚀。2022年4月6日更新。https://github.com/ultralytics/yolov5/issues/475在开始之前克隆仓库并且在一个Python>=3.7.0环境下安装requirements.txt,包括PyTorch>=1.7.Models和datasets自动下载 从最新的 YOLOv5release.git clone htt......原创 2022-04-12 17:04:38 · 8947 阅读 · 6 评论 -
【推理加速】博客翻译:利用融合conv和bn的方法加速模型
这是量化和推理优化模型中常用技术。今天我们将试着理解如何使我们的模型在推理上更快一些。大量的网络使用 BN 来提高网络的泛化能力 。但是在推理阶段,Batch Normalization 被关闭,取代使用的是每个通道的均值和方差的近似值。最酷的是我们可以通过1x1卷积实现同样的行为。更好的是,我们可以把BN和前面的卷积合并。Speeding up model with fusing batch normalization and convolution - LearnML.Today..原创 2022-04-11 15:45:56 · 3385 阅读 · 0 评论 -
【目标检测-YOLO】博客阅读:Introduction to the YOLO Family
介绍YOLO家族目标检测是计算机视觉研究的重要课题之一。大多数计算机视觉问题都涉及到检测视觉对象类别,如行人、汽车、公共汽车、人脸等。这一领域不仅局限于学术界,而且在视频监控、医疗保健、车载传感和自动驾驶等领域具有潜在的现实商业用例。许多用例,特别是自主驾驶,都要求高精度和实时推理速度。因此,选择一个对象检测器,适合的速度和准确性成为必不可少的法案。YOLO (You Only Look Once)是一个单级对象检测器,用于实现两个目标(即速度和准确性)。今天,我们将通过涵盖所有YOLO变体(如原创 2022-04-07 23:58:56 · 1923 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5 Test-Time Augmentation (TTA) 教程
📚 This guide explains how to use Test Time Augmentation (TTA) during testing and inference for improved mAP and Recall with YOLOv5 🚀. UPDATED 25 January 2022.Before You StartClone repo and installrequirements.txtin aPython>=3.7.0environment, inc....原创 2022-04-12 17:26:27 · 4029 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-6.1v实践过程
1. 下载源码:wget https://github.com/ultralytics/yolov5/archive/refs/tags/v6.1.zipunzip v6.1.zip && rm v6.1.zip2. 添加 yolov5-6.1/data/VOCTVlogo2022.yaml。这里我是YOLO v5 训练自定义数据集_星魂非梦的博客-优快云博客复制的。3. 下载预训练权重:wget https://github.com/ultralytics/yolov.原创 2022-04-12 17:38:53 · 3584 阅读 · 9 评论 -
【推理加速】优化sigmoid
本文是优化小技巧sigmoid_哔哩哔哩_bilibili的学习笔记!知识点是在深度学习部署中,对sigmoid 求反函数,用来加速推理,原因是desigmoid_threshold 可以提前算出,只需计算一次即可。神经网络常使用sigmoid 函数将 卷积后的结果x转换为概率output。比如,YOLO系列和CenterNet等等。公式:,一个exp,一个除法,比较耗时,尤其是嵌入式上面。优化:得到:源代码:ifsigmoid(P[4]) >......原创 2022-04-11 10:38:07 · 1645 阅读 · 1 评论 -
【目标检测-YOLO】YOLOv3
YOLOv3: An Incremental ImprovementAbstractAt 320*320 YOLOv3 runs in 22 ms at 28.2 mAP, as accurate as SSD but three times faster. When we look at the old .5 IOU mAP detection metric YOLOv3 is quite good. It achieves 57.9 AP50 in 51 ms on a Titan X, com原创 2022-02-25 00:06:45 · 1971 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-v6.0-yolov5s网络架构详解(第一篇)
趁热打铁。上节分析了 v5.0 的 yolov5s 模型架构,本节顺便把 v6.0的图也画下。官方代码中贴心的给提供了 onnx 文件,如下图:但是,当我打开 onnx 的时候,我麻了...所以,还是需要自己生成下 onnx 文件。打开export.py 惊喜发现,代码中提供了onnx-simplifier导出,这种导出的模型更加简洁。https://github.com/daquexian/onnx-simplifierhttps://github.com/daquexian/o...原创 2022-03-18 20:29:00 · 10846 阅读 · 14 评论 -
【目标检测】锚框(anchor box)理解和代码实现--《动手学深度学习V2》
本人对锚框的理解。锚框(anchor box)理解和代码实现 - 知乎原创 2022-01-05 15:34:32 · 2143 阅读 · 0 评论 -
【目标检测-YOLO】YOLO v2总结
yolov2 损失yolov2 输出 13*13*5*(4+1+20) 张量(VOC数据集)13*13 个 grid cell;每个 grid cell 有5个 预测框,每个预测框 有 4个坐标(x, y, w, h) + 1 个置信度(c) + 20 个条件类别概率。对于每张图像,损失函数包含两部分:遍历 每个grid cell, 假设 当前grid cell 的 5个 预测框 为 (b1, b2, b3, b4, b5),5个 Anchor框 为 (A1,...原创 2022-02-22 16:05:51 · 2594 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-5.0v-数据处理(第三篇)
前文链接:YOLOv5-v5.0-yolov5s网络架构详解(第一篇)_星魂非梦的博客-优快云博客YOLOv5-5.0v-yaml 解析(第二篇)_星魂非梦的博客-优快云博客YOLO Input Backbone Neck Head 置信度Loss 坐标回归Loss 分类Loss v1 448*448 GoogleNet FC*2 MSE v2 32x DarkNet-19 Passth.原创 2022-03-27 22:52:59 · 13896 阅读 · 3 评论 -
【目标检测-YOLO】YOLO v5 训练自定义数据集
yolov5 训练自定义的voc 格式的数据原创 2022-02-18 17:57:30 · 9289 阅读 · 2 评论 -
【目标检测-YOLO】PP-YOLO(v3版本)
本文下载的论文是 arXiv:2007.12099v3 [cs.CV] 3 Aug 2020PP-YOLO: An Effective and Effificient Implementation of Object Detector百度摘要Due to limitation of hardware, it is often necessary to sacrififice(牺牲)accuracy to ensure the infer speed of the detector in p.原创 2022-03-31 18:46:04 · 829 阅读 · 0 评论 -
【目标检测-YOLO】YOLO_V1总结
重新思考yolov1原创 2022-02-10 18:47:59 · 2228 阅读 · 0 评论 -
【目标检测-YOLO】YOLO v4 更多细节(第三篇)
YOLO-从零开始入门目标检测 - 知乎睿智的目标检测30——Pytorch搭建YoloV4目标检测平台_Bubbliiiing的学习小课堂-优快云博客_yolov4目标检测增强CNN学习能力的Backbone:CSPNet - 知乎YOLOv4特征提取网络——CSPDarkNet结构解析及PyTorch实现 - 知乎YOLOv4 介绍及其模型优化方法 - 知乎数据增强DropblockYolov4中使用的Dropblock,其实和常见网络中的Dropout功能类似,也是缓原创 2022-03-14 16:20:19 · 5359 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-v6.0-网络架构详解(第二篇)
YOLOv5-v6.0-网络架构详解,包含架构图原创 2022-03-31 10:30:49 · 16622 阅读 · 20 评论 -
【目标检测-YOLO】YOLOv5-5.0v-损失函数(第四篇)
4. 损失函数4.1 正负样本分配4.2 损失函数原创 2022-03-30 10:41:55 · 14434 阅读 · 17 评论 -
【目标检测-YOLO】YOLOv5-yolov5s TensorRT部署准备之ONNX导出(第一篇)
下面的内容是对 YOLOv5-yolov5s TensorRT部署前的准备之导出可用的ONNX。之前已经写过部分内容,但是还不够详细。1. YOLOv5-6.0版本以下内容以 6.0 版本为准。修改导出文件: def forward(self, x): z = [] # inference output for i in range(self.nl): x[i] = self.m[i](x[i]) # conv2d原创 2022-04-01 20:31:38 · 7721 阅读 · 26 评论 -
【目标检测-YOLO】YOLO_V2
接上文YOLOv2 改进在哪里?BN 高分辨率分类器 引入 Anchor 对数据集进行 k-means 聚类得到Anchor 约束模型输出范围 底层细粒度特征 + 顶层特征 多尺度训练BN参考:批量归一化和层归一化_hymn1993的博客-优快云博客_层归一化通常,将批量规范化层置于全连接层中的仿射变换和激活函数之间。优点:使深度网络容易训练(容易收敛) 改善梯度流(避免梯度消失和爆炸) 可以使用较大学习率,更快收敛 对网络初始化更加 稳健...原创 2022-02-20 21:06:07 · 1495 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-5.0v-yaml 解析及模型构建(第二篇)
YOLOv5 中网络结构的配置使用 yaml 文件。模型详解。原创 2022-03-20 17:03:41 · 7870 阅读 · 28 评论 -
【核心概念】图像分类和目标检测中的正负样本划分以及架构理解
图像分类和目标检测中的正负样本划分以及架构理解原创 2022-02-09 16:41:42 · 4089 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv5-v5.0-yolov5s网络架构详解(第一篇)
源码:GitHub - ultralytics/yolov5 at v5.0由于YOLO v5 代码库在持续更新,如上图,有多个版本,每个版本的网络结构不尽相同。以下内容以 v5.0 为准,网络结构选用 yolov5s。为了方便画图和理解网络结构,选用可视化工具:Netron 网页版进行可视化, 然后使用PPT作图。在Releases · ultralytics/yolov5 · GitHub找到 v5.0中的Assets 中的yolov5s.pt并下载该权重。下图为直接......原创 2022-03-18 16:19:24 · 20395 阅读 · 4 评论 -
【目标检测-YOLO】YOLO v4 架构以及网络详解(第二篇)
可能还会继续丰富原创 2022-03-10 15:22:11 · 5594 阅读 · 4 评论 -
【目标检测-YOLO】YOLO v4 总结(第四篇)
目标检测算法(YOLOv4)_Victory_gx的博客-优快云博客_giou lossYOLO-从零开始入门目标检测 - 知乎睿智的目标检测30——Pytorch搭建YoloV4目标检测平台_Bubbliiiing的学习小课堂-优快云博客_yolov4目标检测增强CNN学习能力的Backbone:CSPNet - 知乎YOLOv4特征提取网络——CSPDarkNet结构解析及PyTorch实现 - 知乎YOLOv4 介绍及其模型优化方法 - 知乎深度学习之学习(..原创 2022-03-14 18:58:28 · 5125 阅读 · 0 评论 -
【目标检测-YOLO】YOLO v5 训练最好结果的技巧
来自:Tips for Best Training Results 📌 - YOLOv5 DocumentationTips for Best Training Results训练最好结果的技巧👋 Hello! 📚 This guide explains how to produce the best mAP and training results with YOLOv5 🚀.Most of the time good results can be obtained with no cha原创 2022-03-17 22:58:39 · 9794 阅读 · 22 评论 -
【目标检测】FPN
Feature Pyramid Networks for Object Detection摘要5 FPS on a GPU(有点慢)1. 引言d 为FPN,速度和 b、c相似,但是更精准。图中,蓝色框表示特征图,粗的框表示语义强壮的特征。These pyramids are scale-invariant in the sense that an object’s scale change is offset by shifting its level in the pyramid.原创 2022-02-24 15:50:25 · 1560 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv3总结
YOLOv3 的架构总结和损失函数理解以及正负样本分配原创 2022-02-28 14:38:02 · 3678 阅读 · 3 评论 -
【目标检测-YOLO】YOLOv5-6.0-P6 1280 Models(第三篇)
5.0 版本发布了 YOLOv5-P6 模型。This release implements YOLOv5-P6 models and retrained YOLOv5-P5 models. All model sizes YOLOv5s/m/l/x are now available in both P5 and P6 architectures:YOLOv5-P6models:4 output layersP3, P4, P5, P6 at strides 8, 16, 32, 64 tr...原创 2022-03-31 15:50:17 · 8248 阅读 · 6 评论 -
【目标检测-预处理】高性能实现
本文是你真的理解高性能吗-预处理高性能_哔哩哔哩_bilibiq的学习笔记!预处理指的是 把图像变成 tensor 输入到神经网络去的过程。首先看 YOLOX 的实现:YOLOX/yolox.cpp at main · Megvii-BaseDetection/YOLOX · GitHub cv::Mat img = cv::imread(input_image_path); int img_w = img.cols; int img_h = img.rows; .原创 2022-04-09 11:19:19 · 3215 阅读 · 0 评论 -
【目标检测-YOLO】YOLOv4(第一篇)
YOLO v4 论文翻译原创 2022-03-05 16:53:50 · 3064 阅读 · 0 评论 -
【目标检测-YOLO】YOLOX(第一篇)
文章链接:https://arxiv.org/pdf/2107.08430.pdfYOLOX是2021年8月 旷视发布的一篇论文,它是继YOLOv1后第一篇Anchor-free 的YOLO目标检测框架。本文对论文进行学习。YOLOX: Exceeding YOLO Series in 2021摘要YOLOX:anchor-free;decoupled head;label assignment strategy:SimOTAYOLONano:0.91M parameters;1.0原创 2022-04-08 15:06:18 · 3624 阅读 · 0 评论