- 博客(51)
- 收藏
- 关注
原创 DEIM-DEIMv2: 一种高效的训练框架,用于加速DETR实时目标检测的收敛性
DEIMv2使用DINOv3带来的全新特征提取可部署在大中小终端上
2025-12-20 17:59:40
242
原创 OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.
OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.
2025-10-11 21:08:53
275
原创 解决docker配置了镜像源但还会拉取官方镜像源的问题
解决docker配置了镜像源但还会拉取官方镜像源 docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": context deadline exceeded
2025-09-12 10:18:10
1032
2
原创 CUDA error: device-side assert triggered的其中一个解决方法——数据集标签
摘要:CUDA内核运行时触发assert失败但未立即暴露,可能在后续NCCL通信中才显现。建议使用TORCH_USE_CUDA_DSA启用设备端断言。主要原因可能包括:1)标签索引越界;2)非法张量操作;3)NaN或无效值。解决方法包括检查标签范围、映射负数类别ID等。针对D-FINE模型,可参考相关博客和代码(如coco_dataset.py)进行调试优化。
2025-09-03 17:08:55
882
原创 【CVPR2025】| SCSegamba: 用于结构裂纹分割的轻量级结构感知视觉Mamba
一个轻量级结构感知视觉Mamba网络(SC-Segamba),利用裂纹像素的形态信息和纹理线索,以最小的计算成本生成高质量的像素级分割图。
2025-09-02 10:31:29
1017
原创 【CVPR2025】Mr.DETR: 通过多路线训练机制改进DETR,并进行“one to one”和“one to many”的预测
提出了Instructive Multi-Route Training的方法,通过在训练时并行使用一个主“一对一”预测路径和两个辅助的“一对多”预测路径,来更有效地训练Detection Transformers,从而在不增加推理成本的情况下提升模型在目标检测等任务上的性能。
2025-08-06 21:48:04
1350
1
原创 YOLOv13:最新的YOLO目标检测算法
YOLOv13:利用超图增强型自适应视觉感知进行实时物体检测主要的创新点提出了HyperACE机制、FullPAD范式、轻量化模块设计
2025-06-30 20:33:23
1785
原创 D-FINE使用pth权重批量推理可视化图片
修改D-FINE官方源码的根目录下的tools/inference/torch.inf.py推理方式
2025-06-07 10:45:37
361
原创 论文解读 | YOLOv12: Attention-Centric Real-Time Object Detectors
对YOLOv12网络结构进行了详细地介绍,也介绍了里面热图以及可视化特征图的绘制方法
2025-06-04 18:28:39
1210
原创 解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化
解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化
2025-06-02 23:16:21
1765
5
原创 使用Slurm训练模型出现Duplicate GPU detected : rank 1 and rank 0 both on CUDA device 2000错误
Duplicate GPU detected : rank 1 and rank 0 both on CUDA device 2000
2025-05-26 16:26:38
808
原创 论文解读:ICLR2025 | D-FINE
D-FINE 是一款功能强大的实时物体检测器,它将 DETRs 中的边界框回归任务重新定义为细粒度分布细化(FDR),并引入了全局最优定位自蒸馏(GO-LSD),在不引入额外推理和训练成本的情况下表现出了最佳性能
2025-05-17 15:41:23
1536
原创 使用ultralytics框架训练模型后可视化结果
用ultralytics框架训练模型后会在runs/detect下生成关于训练相关的权重等文件,里面会有metrics和loss的结果图,不过他们是分开可视化,有时候需要把他们会在同一幅图上去分析和观察,那么可以从results.csv文件中选择需要的指标去可视化
2025-05-05 17:02:26
524
原创 沥青路面裂缝的目标检测与图像分类任务
文章采用了一种基于网格分类和基于框的检测(GCBD),其中基于网格分类的部分主要用于对裂缝区域进行细粒度划分,同时进行分类和检测
2025-05-02 21:46:42
1430
4
原创 论文解读:CVPR2025中的一篇论文 | LLMDet
LLMDet利用LLM生成图像级详细描述和区域级详细描述,作为目标检测器的训练监督信号,从而提高检测器的语义理解和泛化能力
2025-04-19 23:22:19
1852
原创 安装albumentations出现的问题:ERROR: Failed building wheel for simsimd
安装albumentations出现的问题
2025-03-25 09:17:50
664
原创 服务端使用ASP.NET Core SignalR与Vue3(TypeScript与JavaScript)前端建立通信(以进度条为例)
服务端使用ASP.NET Core SignalR与Vue3(TypeScript与JavaScript)前端建立通信(以进度条为例)
2022-09-20 17:01:24
1991
2
原创 香港实景三维模型获取、SuperMap iDesktopX处理、服务发布与加载
香港实景三维模型获取、SuperMap iDesktopX处理、服务发布与加载
2022-05-29 16:02:04
2429
9
原创 VMware创建虚拟机,安装Linux系统——Ubuntu22.04版本
VMware软件获取,创建虚拟机,安装Linux系统——Ubuntu22.04版本
2022-05-08 09:40:30
1863
原创 JavaScript语法——注释、大小写、字面量、变量、标识符和数据类型
JavaScript语法——注释、大小写、字面量、变量、标识符和数据类型
2022-04-24 09:32:12
759
原创 Git下载与安装
Git的发展历史此处暂时不详细介绍。官网地址:Githttps://git-scm.com/下载:点击此处则会自动识别计算机的操作系统位数,从而自动下载,如果访问不到页面,则需要借助科学上网工具来解决。如有需要可自行提取。链接:https://pan.baidu.com/s/1KOruBCMoS2l3M8Mz5h0teQ提取码:84cs 此处的版本时2022年最新版,2.35.2。下载完成以...
2022-04-13 17:16:22
823
2
原创 小批量梯度下降法,MNIST数据集
小批量梯度下降法在趋向最小损失方面更快,可以加速网络模型的训练速度,可能还会占有较少的内存资源。采用这样的方式加速模型的训练速度,会为我们之后的调参带来好处。 在之前所用的梯度下降法,被称之为批量梯度下降法,它是将所有的训练样本聚类成一个大的批量,然后计算整个批量的损失函数。而小批量梯度下降法是将训练集分割成更小的批量,然后对每个批量进行单步的梯度下降迭代计算。 我们依旧采用MNIST数据集,先要对整个训练样本数据集分成若干个批量,用函数分装起来,我们的代...
2022-04-12 11:09:27
1972
原创 MNIST数据集,图像识别(四)
接下来,我们来训练神经网络模型,但在此之前,需要介绍一下反向传播算法。 反向传播(backpropagation),简称为BP算法,是一种能够计算网络梯度的算法,使用求导的链式法则计算神经网络相对于权重的损失梯度,它工作的原理可以理解为是逐层求导,就是链式法则求导。我们使用BP算法就是用来计算神经网络中权重的梯度,从而进行模型的训练。但是,这与我们之前所用的梯度下降法是有区别的。 我们知道,正向传播的方向是从输入到输出,反向传播的方向是从损失回到权重,通过...
2022-04-11 18:58:19
1793
原创 MNIST数据集,图像识别(三)
采用神经网络预测MNIST数据集查看本篇博客,需要看一下前两篇博客,相信你会有所收获的!1、构建神经网路采用连接两个感知机,或者说是按照神经网络的输入层、隐藏层和输出层的结构对我们第二篇博客中提出的方法加以改进。同时,我们加入softmax函数,我们看下其公式:softmax函数会返回一个数值数组(我们用logit表示),其中每个元素的取值都是在0-1之间的,它的输出总和恒为1,就是softmax函数将这个总和进行了归一化处理。 现在...
2022-04-11 10:33:59
1487
原创 MNIST数据集,图像识别(二)
预测所有的数字,现在我们将mnist.py文件里面从加载标签以后的代码做以修改。def encode_digit(Y, digit): encoded_Y = np.zeros_like(Y) n_labels = Y.shape[0] for i in range(n_labels): if Y[i] == digit: encoded_Y[i][0] = 1 return encoded_YTRAININ...
2022-04-10 15:51:59
648
原创 MNIST数据集,图像识别(一)
1、MNIST简介 MNIST是一组带标签的图像集合,专门为监督学习组装而成,是改良的NIST。官网有这样的一段描述性话语:“It is a subset of a larger set available from NIST. The digits have been size-normalized and centered in a fixed-size image.”MNIST包含了若干手写的数字图像,其数值也是该图像的标签。每个图像的像素是28px*28px的灰度像素。 ...
2022-04-10 13:43:07
5430
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅