悠悠海风-优快云博客

原创 DEIM-DEIMv2: 一种高效的训练框架，用于加速DETR实时目标检测的收敛性

DEIMv2使用DINOv3带来的全新特征提取可部署在大中小终端上

2025-12-20 17:59:40 242

原创 OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.

OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.

2025-10-11 21:08:53 275

原创解决docker配置了镜像源但还会拉取官方镜像源的问题

解决docker配置了镜像源但还会拉取官方镜像源 docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": context deadline exceeded

2025-09-12 10:18:10 1032 2

原创 CUDA error: device-side assert triggered的其中一个解决方法——数据集标签

摘要：CUDA内核运行时触发assert失败但未立即暴露，可能在后续NCCL通信中才显现。建议使用TORCH_USE_CUDA_DSA启用设备端断言。主要原因可能包括：1)标签索引越界；2)非法张量操作；3)NaN或无效值。解决方法包括检查标签范围、映射负数类别ID等。针对D-FINE模型，可参考相关博客和代码（如coco_dataset.py）进行调试优化。

2025-09-03 17:08:55 882

原创【CVPR2025】| SCSegamba: 用于结构裂纹分割的轻量级结构感知视觉Mamba

一个轻量级结构感知视觉Mamba网络(SC-Segamba)，利用裂纹像素的形态信息和纹理线索，以最小的计算成本生成高质量的像素级分割图。

2025-09-02 10:31:29 1017

原创 faster-coco-eval库增加对每个类别的指标评价附代码

faster-coco-eval库增加对每个类别的指标评价附代码

2025-08-07 17:07:31 378 1

原创【CVPR2025】Mr.DETR: 通过多路线训练机制改进DETR，并进行“one to one”和“one to many”的预测

提出了Instructive Multi-Route Training的方法，通过在训练时并行使用一个主“一对一”预测路径和两个辅助的“一对多”预测路径，来更有效地训练Detection Transformers，从而在不增加推理成本的情况下提升模型在目标检测等任务上的性能。

2025-08-06 21:48:04 1350 1

原创已有YOLO格式数据集一键转换为COCO格式

已有YOLO格式数据集一键转换为COCO格式

2025-07-22 16:04:40 302

原创 YOLOv13：最新的YOLO目标检测算法

YOLOv13：利用超图增强型自适应视觉感知进行实时物体检测主要的创新点提出了HyperACE机制、FullPAD范式、轻量化模块设计

2025-06-30 20:33:23 1785

原创 D-FINE使用pth权重批量推理可视化图片

修改D-FINE官方源码的根目录下的tools/inference/torch.inf.py推理方式

2025-06-07 10:45:37 361

原创使用官方代码和自定义数据集训练YOLOv12

简单介绍了使用官方代码和自定义数据集训练YOLOv12

2025-06-04 20:49:35 791

原创论文解读 | YOLOv12: Attention-Centric Real-Time Object Detectors

对YOLOv12网络结构进行了详细地介绍，也介绍了里面热图以及可视化特征图的绘制方法

2025-06-04 18:28:39 1210

原创解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化

解读ultralytics框架训练YOLO输出的labels.jpg和labels_correlogram.jpg以及对results.csv中的内容进行可视化

2025-06-02 23:16:21 1765 5

原创使用Slurm训练模型出现Duplicate GPU detected : rank 1 and rank 0 both on CUDA device 2000错误

Duplicate GPU detected : rank 1 and rank 0 both on CUDA device 2000

2025-05-26 16:26:38 808

原创数据集YOLO格式转换COCO格式

数据集YOLO格式转换COCO格式

2025-05-23 17:43:49 253

原创论文解读：ICLR2025 | D-FINE

D-FINE 是一款功能强大的实时物体检测器，它将 DETRs 中的边界框回归任务重新定义为细粒度分布细化（FDR），并引入了全局最优定位自蒸馏（GO-LSD），在不引入额外推理和训练成本的情况下表现出了最佳性能

2025-05-17 15:41:23 1536

原创使用ultralytics框架训练模型后可视化结果

用ultralytics框架训练模型后会在runs/detect下生成关于训练相关的权重等文件，里面会有metrics和loss的结果图，不过他们是分开可视化，有时候需要把他们会在同一幅图上去分析和观察，那么可以从results.csv文件中选择需要的指标去可视化

2025-05-05 17:02:26 524

原创沥青路面裂缝的目标检测与图像分类任务

文章采用了一种基于网格分类和基于框的检测（GCBD），其中基于网格分类的部分主要用于对裂缝区域进行细粒度划分，同时进行分类和检测

2025-05-02 21:46:42 1430 4

原创目标检测中的损失函数(三) | SIoU WIoUv1 WIoUv2 WIoUv3

目标检测中的SIoU和WIoU损失函数

2025-05-02 16:13:44 1504

原创目标检测中的损失函数(二) | BIoU RIoU α-IoU

目标检测中的损失函数

2025-04-21 17:27:26 1108

原创目标检测中的损失函数(一) | IoU GIoU DIoU CIoU EIoU Focal-EIoU

目标检测中的边界框回归损失函数

2025-04-20 17:33:05 1480

原创论文解读：CVPR2025中的一篇论文 | LLMDet

LLMDet利用LLM生成图像级详细描述和区域级详细描述，作为目标检测器的训练监督信号，从而提高检测器的语义理解和泛化能力

2025-04-19 23:22:19 1852

原创安装albumentations出现的问题：ERROR: Failed building wheel for simsimd

安装albumentations出现的问题

2025-03-25 09:17:50 664

原创根据TXT文件的内容重命名图片——以百度街景为例

根据TXT文件的内容重命名图片——以百度街景为例

2023-03-07 22:21:21 442

原创城市矢量路网获取以及根据此数据制作点数据

通过使用OpenStreetMap获取城市矢量路网

2023-01-08 17:03:01 1838

原创服务端使用ASP.NET Core SignalR与Vue3(TypeScript与JavaScript)前端建立通信(以进度条为例)

服务端使用ASP.NET Core SignalR与Vue3(TypeScript与JavaScript)前端建立通信(以进度条为例)

2022-09-20 17:01:24 1991 2

原创香港实景三维模型获取、SuperMap iDesktopX处理、服务发布与加载

香港实景三维模型获取、SuperMap iDesktopX处理、服务发布与加载

2022-05-29 16:02:04 2429 9

原创 VMware创建虚拟机，安装Linux系统——Ubuntu22.04版本

VMware软件获取，创建虚拟机，安装Linux系统——Ubuntu22.04版本

2022-05-08 09:40:30 1863

原创 JavaScript语法——注释、大小写、字面量、变量、标识符和数据类型

JavaScript语法——注释、大小写、字面量、变量、标识符和数据类型

2022-04-24 09:32:12 759

原创 JavaScript语句（statement）与代码编写位置

JavaScript语句（statement）与代码编写位置

2022-04-24 09:23:54 212

原创 JavaScript起源、发展历史及设计的缺陷

JavaScript起源、发展历史及设计的缺陷

2022-04-24 09:14:55 679

原创 MNIST数据集，图像识别（五）

使用神经网络模型提高MNIST数据集预测的准确率

2022-04-18 10:10:19 1762

Git的发展历史此处暂时不详细介绍。官网地址：Githttps://git-scm.com/下载：点击此处则会自动识别计算机的操作系统位数，从而自动下载，如果访问不到页面，则需要借助科学上网工具来解决。如有需要可自行提取。链接：https://pan.baidu.com/s/1KOruBCMoS2l3M8Mz5h0teQ提取码：84cs 此处的版本时2022年最新版，2.35.2。下载完成以...

2022-04-13 17:16:22 823 2

原创小批量梯度下降法，MNIST数据集

小批量梯度下降法在趋向最小损失方面更快，可以加速网络模型的训练速度，可能还会占有较少的内存资源。采用这样的方式加速模型的训练速度，会为我们之后的调参带来好处。在之前所用的梯度下降法，被称之为批量梯度下降法，它是将所有的训练样本聚类成一个大的批量，然后计算整个批量的损失函数。而小批量梯度下降法是将训练集分割成更小的批量，然后对每个批量进行单步的梯度下降迭代计算。我们依旧采用MNIST数据集，先要对整个训练样本数据集分成若干个批量，用函数分装起来，我们的代...

2022-04-12 11:09:27 1972

原创 MNIST数据集，图像识别（四）

接下来，我们来训练神经网络模型，但在此之前，需要介绍一下反向传播算法。反向传播（backpropagation），简称为BP算法，是一种能够计算网络梯度的算法，使用求导的链式法则计算神经网络相对于权重的损失梯度，它工作的原理可以理解为是逐层求导，就是链式法则求导。我们使用BP算法就是用来计算神经网络中权重的梯度，从而进行模型的训练。但是，这与我们之前所用的梯度下降法是有区别的。我们知道，正向传播的方向是从输入到输出，反向传播的方向是从损失回到权重，通过...

2022-04-11 18:58:19 1793

原创 MNIST数据集，图像识别（三）

采用神经网络预测MNIST数据集查看本篇博客，需要看一下前两篇博客，相信你会有所收获的！1、构建神经网路采用连接两个感知机，或者说是按照神经网络的输入层、隐藏层和输出层的结构对我们第二篇博客中提出的方法加以改进。同时，我们加入softmax函数，我们看下其公式：softmax函数会返回一个数值数组（我们用logit表示），其中每个元素的取值都是在0-1之间的，它的输出总和恒为1，就是softmax函数将这个总和进行了归一化处理。现在...

2022-04-11 10:33:59 1487

原创 MNIST数据集，图像识别（二）

预测所有的数字，现在我们将mnist.py文件里面从加载标签以后的代码做以修改。def encode_digit(Y, digit): encoded_Y = np.zeros_like(Y) n_labels = Y.shape[0] for i in range(n_labels): if Y[i] == digit: encoded_Y[i][0] = 1 return encoded_YTRAININ...

2022-04-10 15:51:59 648

原创 MNIST数据集，图像识别（一）

1、MNIST简介 MNIST是一组带标签的图像集合，专门为监督学习组装而成，是改良的NIST。官网有这样的一段描述性话语：“It is a subset of a larger set available from NIST. The digits have been size-normalized and centered in a fixed-size image.”MNIST包含了若干手写的数字图像，其数值也是该图像的标签。每个图像的像素是28px*28px的灰度像素。 ...

2022-04-10 13:43:07 5430

空空如也

空空如也