自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 Yolo-Uniow开集目标检测本地复现

本文主要记录Yolo-Uniow模型本地推理过程

2025-03-11 16:50:30 1077 6

原创 基于向量数据库的分类模型类别扩充方法(以图搜图)

使用以图搜图的思想实现分类模型不重新训练进行类别扩充

2024-12-20 14:34:00 379

原创 Chinese-Clip实现以文搜图和以图搜图

使用clip实现以文搜图和以图搜图的图文检索功能

2024-12-17 19:17:14 1730

原创 yolov8-cls的onnx与tensorrt推理

yolov8分类模型的部署方式

2024-11-14 14:21:57 1027

原创 解决Corrupt JPEG data: premature end of data segment

解决Corrupt JPEG data: premature end of data segment导致的模型精度下降的问题

2024-10-31 21:16:26 1182 2

原创 ms-swift+llamacpp+ollama微调部署MiniCPM-V教程

介绍了如何使用ms-swift对minicpm-v进行微调,并且使用llama.cpp进行量化,ollama部署及调用

2024-10-28 14:34:42 903

原创 微调Grounding DINO

微调grounding dino

2024-10-09 16:31:35 1942 34

原创 JETSON AGX ORIN结合owl+qwen2.5实现开放语义目标检测

本文使用jetson实现开放目标检测,涉及到llama-factory、llama.cpp、ollama、qwen2.5、owl等工具或模型的使用

2024-10-09 15:43:21 1730

原创 解决OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file

解决hugging face无法下载模型的问题

2024-09-25 10:33:22 4228 7

原创 编译可使用cuda加速的opencv教程

摘要:详细介绍了cuda加速版的opencv的编译过程

2024-07-04 19:32:42 1326

原创 DVC保姆级教程

摘要:介绍了数据版本控制(DVC)基础使用操作

2024-06-29 21:10:03 2855

原创 解决When localhost is not accessible, a shareable link must be created.

解决ValueError: When localhost is not accessible, a shareable link must be created. Please set share=True or check your proxy settings to allow access to localhost.

2025-03-31 14:01:18 265

原创 Qwen2.5-VL实现本地AWQ量化

文章介绍了Qwen2.5-VL模型的本地AWQ量化方法、VLLM部署及python调用方法

2025-03-28 17:35:57 362 3

原创 qwen2.5-vl复现日志

实现qwen2.5-vl的本地推理

2025-03-17 11:25:26 278

原创 labelme标注的json标签转换为yolo格式标签

labelme数据转yolo数据

2025-03-07 16:36:49 327

原创 labelimg标注的xml标签转换为yolo格式标签

xml转txt格式数据脚本

2025-03-07 16:27:17 444

原创 sherpa-onnx使用http协议实现在线语音转文本

最近有一个客户需求,使用语音输入转成文本完成大模型文本输入,测试了whisper和sherpa-onnx模型的表现,发现whisper太慢了,sherpa-onnx可以兼容速度和准确度,因此使用该模型进行部署测试。

2025-02-26 13:58:33 312

原创 不规则图形的拟合方法

使用opencv进行不规则多边形逼近

2025-02-20 17:00:26 162

原创 华为NPU使用docker部署llama-factory

华为服务器安装llama-factory

2025-02-11 15:00:55 622

原创 华为EulerOS 2.0安装docker(aarch64)

文章介绍了如何在华为EulerOS上安装docker

2025-02-11 09:55:57 389

原创 解决json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

解决json读取报错json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

2024-12-31 16:00:42 650

原创 微调OwlVit

微调owlvit

2024-12-24 16:48:06 626 19

原创 Chinese-Clip实现以文搜图和以图搜图(transformers版)

使用transformers库实现以图搜图和以文搜图

2024-12-18 18:03:46 1085

原创 C++实现CenterCrop和短边resize

使用C++实现yolov8-cls的前处理

2024-11-18 14:01:22 319

原创 Linux下使用脚本自动激活conda环境

linux如何使用脚本自动激活环境

2024-11-12 10:09:48 522

原创 pycharm解决ImportError: libnvinfer.so.8: cannot open shared object file: No such file or directory

解决pycharm无法识别tensorrt系统环境变量的问题

2024-11-08 16:09:08 410 1

原创 Tensorrt安装及分类模型tensorrt推理,并生成混淆矩阵

分类模型使用tensorrt推理,包括tensorrt安装及推理

2024-11-08 15:53:28 514

原创 分类模型onnx推理,并生成混淆矩阵

onnx推理分类模型

2024-11-05 14:28:30 189

原创 解决[ollama] - Go build fails with undefined reference to `GOMP_parallel‘

解决ollama编译遇到的[ollama] - Go build fails with undefined reference to `GOMP_parallel'

2024-10-29 14:05:31 299

原创 python列表append嵌套操作踩坑记录

python列表append写入None的解决方式

2024-10-12 14:02:12 267

原创 解决RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘

qwen2-vl报错RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16',提供作者的解决方法

2024-09-13 14:27:29 2101 17

原创 pytorch实现多标签分类

pytorch实现多标签分类

2024-09-07 13:47:06 1118

原创 QwenVL微调问题记录

记录QwenVL模型lora微调过程中遇到的问题及解决方案

2024-09-02 15:07:45 402

原创 labelme数据集转sharegpt数据集(Qwen-VL)

QwenVL微调grounding能力需要使用特定格式数据集,这里使用labelme数据集转成sharegpt数据集

2024-08-29 20:29:39 494

原创 labelme数据集转sharegpt数据集(InternVL2)

将labelme数据集转成sharegpt数据集

2024-08-26 15:16:29 343

原创 paddle框架下使用多块GPU进行RT-DETR训练

paddle使用多卡训练rt-detr

2024-08-13 15:38:15 679

转载 Ubuntu22.04安装企业微信

尝试了许多方法,只有博主"小言W"的博客最为简单实用,安装完企业微信后一定要取消自动更新,不然程序会崩溃。

2024-08-08 15:11:02 278

原创 C++实现NV12转RGBA(不借助opencv)

使用C++实现NV12转RGBA

2024-08-08 15:01:59 472

原创 opencv训练自己的级联分类器

摘要:使用opencv训练自己的级联分类器

2024-07-04 19:44:23 631

原创 Python实现RT-DETR的Tensorrt模型推理

摘要:rt-detr的tensorrt模型推理,python实现版

2024-06-29 21:37:26 305 1

Yolo-Uniow权重

适用于网络不好,访问github困难的用户

2025-03-11

lvis-v1-minival-inserted-image-name.json文件

用于hugging face无法访问的用户,一些开源项目会用到这个文件

2025-03-11

miniconda安装包

网络不好的小伙伴可以直接下载这个进行安装

2025-03-04

Audio to text语音转文本工具

本文受启发于https://github.com/jxlpzqc/TMSpeech/releases 如果没有标点输出或断句需求,没必要下载此资源,使用TMSpeech即可,且该软件UI界面更加美观,下载资源如有代码问题可以直接私信作者,作者会尽力所能及的帮助 注:使用时需要打开麦克风权限,不然无法实现转录

2025-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除