自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_45921929的博客

原创【DeepSeek-VL2报告解读】Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

【DeepSeek-VL2报告解读】Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

2025-02-06 13:52:22 1483

原创 YOLOv8教程系列：一、使用自定义数据集训练YOLOv8模型（详细版教程，你只看一篇-＞调参攻略），包含环境搭建/数据准备/模型训练/预测/验证/导出等

YOLOv8教程系列：一、使用自定义数据集训练YOLOv8模型（详细版教程，你只看一篇->调参攻略），包含环境搭建/数据准备/模型训练/预测/验证/导出等

2023-01-13 15:30:31 231419 317

原创多模态推理模型相关开源工作

多模态推理模型相关开源工作

2025-03-10 21:25:01 963

原创【docker好用系列】llama-factory环境配置

【docker好用系列】llama-factory环境配置

2025-03-01 20:07:08 723

原创【Janus-Pro报告解读】Unified Multimodal Understanding and Generation with Data and Model Scaling

【Janus-Pro报告解读】Unified Multimodal Understanding and Generation with Data and Model Scaling

2025-02-06 16:22:03 778

原创使用 Conda 环境创建 Docker 镜像的完整指南

使用 Conda 环境创建 Docker 镜像的完整指南

2024-12-25 21:19:15 936

原创精准提升：从94.5%到99.4%——目标检测调优全纪录

🔍 精准提升：从94.5%到99.4%——目标检测调优全纪录

2024-12-20 13:28:09 1199

原创联合目标检测与图像分类提升数据不平衡场景下的准确率

联合目标检测与图像分类提升数据不平衡场景下的准确率

2024-12-20 11:26:27 949 2

原创【图像分类实用脚本】数据可视化以及高数量类别截断

图像分类时，如果某个类别或者某些类别的数量远大于其他类别的话，模型在计算的时候，更倾向于拟合数量更多的类别；因此，观察类别数量以及对数据量多的类别进行截断是很有必要的。

2024-12-19 13:56:22 580

原创【离线环境迁移】使用Conda打包和还原Python环境指南

【离线环境迁移】使用Conda打包和还原Python环境指南

2024-12-11 10:42:32 588

原创【解决paddlemix报错】ModuleNotFoundError: No module named ‘paddlemix.models.audioldm2‘

【解决paddlemix报错】ModuleNotFoundError: No module named 'paddlemix.models.audioldm2'

2024-12-05 21:17:24 241

原创【多模态论文分享】Rethinking Visual Prompting for Multimodal Large Language Models with External Knowledge

文章提出了一种新的视觉提示方法，旨在将细粒度的外部知识（来自实例分割和OCR模型的信息）直接嵌入到多模态大型语言模型（MLLMs）中，以增强其对图像中细粒度或局部化视觉元素的理解能力。

2024-12-02 13:47:18 780

原创 Mac下的vscode远程ssh免密码登录

Mac下的vscode远程ssh免密码登录（同理可迁移至windows及linux系统）

2024-11-21 14:01:14 1427

原创【基于深度学习的王者荣耀精彩视频方案详解】

基于深度学习的王者荣耀精彩视频方案详解

2024-11-09 17:24:40 153

原创从零到部署指南：Ubuntu上安装Boost和Crow库

从零到部署指南：Ubuntu上安装Boost和Crow库

2024-04-08 11:03:04 767

原创【实战解析】YOLOv9全流程训练至优化终极指南

YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)等开创性技术，标志着实时目标检测领域的重大进步。该模型在效率、准确性和适应性方面都有显著提高，在 MS COCO 数据集上树立了新的标杆。

2024-04-08 10:36:27 7879 11

原创【最佳实践】高效调优目标检测模型

在深入繁复的计算机视觉领域，目标检测无疑是一项挑战且结果至关重要的任务。它在无人驾驶、智能监控行业中扮演着核心角色，直接影响到系统的性能和可靠性。而在这个过程中，调整参数是实现高效、精准目标检测的关键步骤。

2024-04-02 17:51:35 2064

原创【探索多模态视觉问答】数据集概览及特点分析

在计算机视觉和自然语言处理领域，视觉问答（VQA）是一个重要的任务，旨在让计算机理解图像内容并回答关于图像的问题。为了促进和评估多模态模型在视觉问答任务上的表现，研究人员构建了多个丰富的数据集。本文将介绍几个主要的视觉问答数据集，包括VQA v2.0、VizWiz-VQA、GQA、POPE、MM-VET、MME、MMBench和SEED-Bench。我们将分析这些数据集的特点、构建方式以及在评估多模态模型方面的作用，旨在为研究人员提供对多模态视觉问答数据集的全面认识。

2024-03-25 14:55:21 3746

原创 YOLOv8教程系列：五、关闭数据增强

YOLOv8教程系列：五、关闭数据增强

2023-11-09 17:18:04 6732 6

原创解决mmpretrain中的配置类别问题The number of subfolders doesn‘t match the number of specified classes

解决mmpretrain中的配置类别问题The number of subfolders doesn't match the number of specified classes

2023-09-20 17:21:55 1247

原创 DAMO-YOLO训练自己的数据集，使用onnxruntime推理部署

DAMO-YOLO训练自己的数据集，使用onnxruntime推理部署

2023-09-10 11:51:47 1432

原创 YOLOv8教程系列：四、使用yolov8仓库训练自己的图像分类数据集（含推理预测）

YOLOv8教程系列：四、使用yolov8仓库训练自己的图像分类数据集（含推理预测）

2023-08-23 13:55:54 14201 21

原创 YOLOv8教程系列：三、K折交叉验证——让你的每一份标注数据都物尽其用（yolov8目标检测+k折交叉验证法）

YOLOv8教程系列：三、K折交叉验证——让你的每一份标注数据都物尽其用（yolov8目标检测+k折交叉验证法）

2023-08-22 16:55:29 6768 20

原创【ultralytics仓库使用自己的数据集训练RT-DETR】

ultralytics仓库使用自己的数据集训练RT-DETR

2023-08-11 19:50:40 4582 12

原创一键转换labelimg格式为COCO格式

一键转换labelimg格式为COCO格式

2023-07-31 20:20:48 1387

原创 YOLOv8教程系列：三、使用YOLOv8模型进行自定义数据集半自动标注

YOLOv8教程系列：三、使用YOLOv8模型进行自定义数据集半自动标注

2023-07-31 20:15:24 2679

原创【mmdetection中使用COCO预训练模型AP排名】

【mmdetection中使用COCO预训练模型AP排名】

2023-06-29 16:31:53 720

原创 ubuntu环境下测试硬盘读写速度

ubuntu环境下测试硬盘读写速度

2023-06-22 15:35:45 12794

原创解决多ffmpeg环境冲突问题

解决多ffmpeg环境冲突问题

2023-06-20 10:02:51 1067

原创【学习率和训练轮次对于yolov5训练的影响】

【学习率和训练轮次对于yolov5训练的影响】

2023-06-14 20:38:52 7490 1

原创【mmdetection中的--cfg-options使用教程】

【mmdetection中的--cfg-options使用教程】

2023-06-11 14:55:08 1076

原创【深度学习炼丹大杀器——mlrunner初体验（以mmdetection为例）】

【深度学习炼丹大杀器——mlrunner初体验（以mmdetection为例）】自动化炼丹，告别手动运行的烦恼~

2023-06-11 14:37:06 1641

原创使用vscode远程服务器，让代码在vscode关闭后也在服务器后台运行

使用vscode远程服务器，让代码在vscode关闭后也在服务器后台运行

2023-06-11 12:22:39 20499 10

原创 mmdetection中param_scheduler解读

mmdetection中param_scheduler解读

2023-06-11 10:53:02 1415 1

原创【解决deepstream错误】deepstream-app: error while loading shared libraries: libgstrtspserver-1.0.so.0

【解决deepstream错误】deepstream-app: error while loading shared libraries: libgstrtspserver-1.0.so.0

2023-05-18 10:15:06 2046 3

原创使用codon加速你的python程序

使用codon加速你的python程序

2023-04-05 14:42:45 2754 3

原创【目标检测实用脚本系列】修改图片和xml的文件名和属性值

【目标检测实用脚本系列】修改图片和xml的文件名和属性值

2023-03-25 18:03:12 440 2

原创【目标检测实用脚本系列】标注图片裁切成boundingbox的小图

【目标检测实用脚本系列】将labelImg标注的xml标签，按标签名建立文件夹，并将对应的裁切小图保存到文件夹中

2023-03-17 15:11:24 641 2

原创【mmdeploy部署系列】使用Tensorrt加速部署mmpose人体姿态库

【mmdeploy部署系列】使用Tensorrt加速部署mmpose人体姿态库

2023-03-04 17:47:09 2096 2

原创【边缘端环境配置】英伟达Jetson系列安装pytorch/tensorflow/ml/tensorrt环境（docker一键拉取）

【边缘端环境配置】英伟达Jetson系列安装pytorch/tensorflow/ml/tensorrt环境（docker一键拉取）

2023-03-04 14:49:53 4250 1

行人跌倒数据集（VOC格式）

行人跌倒数据集（VOC格式）

2023-01-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除