blanokvaffy
深度学习调参侠
展开
-
More Pictures Say More: Visual Intersection Network for Open Set Object Detection
开放集目标检测近年来备受关注,因为现实世界中物体种类繁多,传统的封闭集检测方法难以处理。现有方法主要分为基于文本和纯视觉两类,前者存在模态差异大、需大量计算资源、受文本语义限制等问题,后者则面临多视觉提示融合质量低的挑战。本文提出视觉交集网络 VINO,通过构建多图像视觉库及多图像更新机制学习语义交集。其贡献在于首次在该领域用多图像语义交集,模型在多基准数据集上性能与先进方法相当,还通过添加分割头验证了通用性。原创 2025-04-16 11:30:03 · 60 阅读 · 0 评论 -
D-FINE-SEG: 将D-FINE改为实例分割模型
将最新的实时目标检测模型D-fine修改为支持掩码输出的实例分割模型。原创 2025-04-16 09:55:06 · 225 阅读 · 3 评论 -
contourformer:实时的轮廓分割transformer
对 SBD 、 COCO 和 KINS 等标准数据集的实验评估表明,该方法明显优于现有的最先进方法,从而验证了其有效性和多功能性。框架建立在 D-FINE 对象检测模型之上,并将边界框的回归扩展到轮廓的回归。为了实现高效的训练,Contourformer 采用迭代方法进行轮廓变形,并引入降噪机制来加速收敛过程。(2) 细粒度分布细化:该模块通过细粒度概率建模和分布优化,进一步提高了分割结果的精度。(1)子轮廓解耦机制:该模块旨在有效地解耦复杂的轮廓关系,增强模型捕捉目标边界的能力;原创 2025-04-04 10:12:54 · 74 阅读 · 0 评论 -
修改D-FINE支持成比例图像缩放训练
记录一下如何将最新的实时目标检测模型D-fine修改为输入图像支持成比例缩放训练的。原创 2024-12-05 16:47:45 · 224 阅读 · 0 评论 -
生成mm grounding dino的onnx模型并在x-anylabeling中使用
X-AnyLabeling 是一款cvhub开发的交互式自动标注工具,其基于AnyLabeling进行构建和二次开发,在此基础上扩展并支持了许多的模型和功能,并借助Segment Anything和YOLO等主流模型提供强大的 AI 支持。其最新版基于grounding dino可以实现开放词汇检测及生成掩码。2024年,MMDet 3.3.0提出了 MM-Grounding-DINO。原创 2024-06-24 15:22:30 · 1182 阅读 · 1 评论 -
《DETRs Beat YOLOs on Real-time Object Detection》将DETR加速至实时SOTA
最近看到百度写的一篇还算不错的DETR论文,通过简化DINO的encoder层将模型加速到实时水平,翻译了下,以作记录。原创 2023-04-18 22:07:55 · 1593 阅读 · 0 评论 -
《DETRs with Collaborative Hybrid Assignments Training》 加入one to many matching 辅助头训练的DETR
最近(2022年)的不少论文都将目光集中在了one to one matching机制上,年初CVPR的Denosing DETR认为one to one matching机制在模型训练的初期导致了损失不稳定,GT无法很好的与query稳定的进行匹配,因此提出了加入噪声干扰的GT输入作为query,与GT进行损失计算来辅助加速DETR模型训练,该课题组在此基础上提出了DINO、Mask DINO等模型,将DETR模式推到了SOTA的水平。辅助one to many matching的分支与原始主分支中的。原创 2022-11-26 22:58:40 · 5243 阅读 · 0 评论 -
TensorRT加速Deformable Detr实践
这让TensorRT便捷实现加速Deformable Detr乃至今年(2022年)最新的DETR类sota模型DINO、Mask DINO成为了可能。查了一下当前网络上并没有关于Deformable Detr 的TensorRT加速的实现方法,可能大佬们都觉的太简单没有必要吧,于是就自己写了一版方便大家使用。对于低于8.4.1.5的TensorRT版本,也可以选择把官方的插件自己编译到旧版本上。库,没有使用官方的原版。自TensorRT 8.4.1.5发布以来,惊喜的发现TensorRT官方实现了。原创 2022-11-26 00:13:47 · 2862 阅读 · 9 评论 -
CUDA实现多batch基数排序
CUDA实现多batch基数排序基数排序是具有固定迭代次数的排序算法, 其通过对最低位到最高位的一一比较,对数值排序。GPU版的基数排序将数据分为N个部分并行进行基数排序,随后并行规约得到排序后的数组。这里实现了一版多batch的基数排序实例,并同时输出原数组的序号,基本实现了argsort的功能,代码如下所示:#include<iostream>#include<cuda_runtime.h>__device__ void preprocess_float(float原创 2022-05-11 20:29:42 · 1124 阅读 · 0 评论 -
dn-detr:通过去噪任务加速detr训练
dn-detr:通过加速detr训练原创 2022-03-08 11:47:02 · 5156 阅读 · 0 评论 -
transformer在视觉检测的应用
transformer在视觉检测的应用detr简介一些基于detr启发论文目标检测Deformable DETRConditional DETRSparse R-cnn实例分割/全景分割SOLQMaskformerK-Net近年,Transformers在计算机视觉领域大放异彩。将transformer带入目标检测/实例分割的工作如过江之鲫,不胜枚举。而2020年Detection Transformers(detr)更是带来一种新的目标检测范式,启发了后续众多的工作。detr简介 detr结构d原创 2021-11-28 21:52:13 · 2886 阅读 · 0 评论 -
使用TensorRT加速ScaledYOLOv4
使用TensoRT加速ScaledYOLOv4测试环境快速开始1、生成onnx模型2、编译3、转换onnx模型到trt模型4、测试速度效果使用mish插件层很多人都写过TensorRT版本的yolo了,我也来写一个。具体代码可参见我的github测试环境ubuntu 18.04pytorch 1.7.1 jetpack 4.4CUDA 11.0TensorRT7.1快速开始1、生成onnx模型 git clone --branch yolov4-csp https://github.c原创 2021-03-29 22:05:48 · 703 阅读 · 0 评论 -
Tensorrt实现solov2加速
Tensorrt实现solov2加速SOLO简介环境依赖快速开始下载代码并编译转换pytorch模型生成FP16模型执行推理测试效果SOLO简介solo系列网络是由Xinlong Wang提出的单阶段实例分割网络。其搭建在mmdetection库中。solov2主干网络如下图所示:其在COCO数据集上获得了较高的AP,并且由于其单阶段实例分割的特点,方面直接实现端到端的部署。因此,我们可以采用pytorch转onnx再转tensorrt的方式实现solo的半精度、int8加速,达到实时运行的目的。所原创 2020-12-04 11:38:40 · 3792 阅读 · 9 评论 -
tensorRT在yolo上的使用
根据lewes6369的TensorRT-yolov3改写了一版基本实现可以推理视频和图片、可以多线程并行加速的TensorRT-yolov3模型,在win10系统和Linux上都成功的进行了编译。源码和编译方式详见我的github。搭建环境ubuntu16 & win10TensorRT 5.1CUDA 9.0 or CUDA 10.0测试效果ModelGPU...原创 2019-04-06 09:05:44 · 4520 阅读 · 3 评论 -
DDPG强化学习pytorch代码
DDPG强化学习pytorch代码参照莫烦大神的强化学习教程tensorflow代码改写成了pytorch代码。具体代码如下.'''torch = 0.41'''import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npimport gymimport time##...原创 2019-01-10 14:48:27 · 16450 阅读 · 19 评论 -
win10下autokeras的入门
win10下autokeras的安装按照官方网站的方法进行安装,注意:Auto-Keras只支持Python3.6。项目github:https://github.com/jhfjhfj1/autokeraspip install autokerasautokeras需要的依赖项很多,包括tensorflow、pytorch、keras、numpy等,大部分在pip安装autokeras都...原创 2018-10-15 14:37:13 · 1966 阅读 · 3 评论