- 博客(68)
- 收藏
- 关注

原创 【DeepSeek-VL2报告解读】Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding
【DeepSeek-VL2报告解读】Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding
2025-02-06 13:52:22
1483

原创 YOLOv8教程系列:一、使用自定义数据集训练YOLOv8模型(详细版教程,你只看一篇->调参攻略),包含环境搭建/数据准备/模型训练/预测/验证/导出等
YOLOv8教程系列:一、使用自定义数据集训练YOLOv8模型(详细版教程,你只看一篇->调参攻略),包含环境搭建/数据准备/模型训练/预测/验证/导出等
2023-01-13 15:30:31
231419
317
原创 【Janus-Pro报告解读】Unified Multimodal Understanding and Generation with Data and Model Scaling
【Janus-Pro报告解读】Unified Multimodal Understanding and Generation with Data and Model Scaling
2025-02-06 16:22:03
778
原创 【图像分类实用脚本】数据可视化以及高数量类别截断
图像分类时,如果某个类别或者某些类别的数量远大于其他类别的话,模型在计算的时候,更倾向于拟合数量更多的类别;因此,观察类别数量以及对数据量多的类别进行截断是很有必要的。
2024-12-19 13:56:22
580
原创 【解决paddlemix报错】ModuleNotFoundError: No module named ‘paddlemix.models.audioldm2‘
【解决paddlemix报错】ModuleNotFoundError: No module named 'paddlemix.models.audioldm2'
2024-12-05 21:17:24
241
原创 【多模态论文分享】Rethinking Visual Prompting for Multimodal Large Language Models with External Knowledge
文章提出了一种新的视觉提示方法,旨在将细粒度的外部知识(来自实例分割和OCR模型的信息)直接嵌入到多模态大型语言模型(MLLMs)中,以增强其对图像中细粒度或局部化视觉元素的理解能力。
2024-12-02 13:47:18
780
原创 【实战解析】YOLOv9全流程训练至优化终极指南
YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)等开创性技术,标志着实时目标检测领域的重大进步。该模型在效率、准确性和适应性方面都有显著提高,在 MS COCO 数据集上树立了新的标杆。
2024-04-08 10:36:27
7879
11
原创 【最佳实践】高效调优目标检测模型
在深入繁复的计算机视觉领域,目标检测无疑是一项挑战且结果至关重要的任务。它在无人驾驶、智能监控行业中扮演着核心角色,直接影响到系统的性能和可靠性。而在这个过程中,调整参数是实现高效、精准目标检测的关键步骤。
2024-04-02 17:51:35
2064
原创 【探索多模态视觉问答】数据集概览及特点分析
在计算机视觉和自然语言处理领域,视觉问答(VQA)是一个重要的任务,旨在让计算机理解图像内容并回答关于图像的问题。为了促进和评估多模态模型在视觉问答任务上的表现,研究人员构建了多个丰富的数据集。本文将介绍几个主要的视觉问答数据集,包括VQA v2.0、VizWiz-VQA、GQA、POPE、MM-VET、MME、MMBench和SEED-Bench。我们将分析这些数据集的特点、构建方式以及在评估多模态模型方面的作用,旨在为研究人员提供对多模态视觉问答数据集的全面认识。
2024-03-25 14:55:21
3746
原创 解决mmpretrain中的配置类别问题The number of subfolders doesn‘t match the number of specified classes
解决mmpretrain中的配置类别问题The number of subfolders doesn't match the number of specified classes
2023-09-20 17:21:55
1247
原创 YOLOv8教程系列:四、使用yolov8仓库训练自己的图像分类数据集(含推理预测)
YOLOv8教程系列:四、使用yolov8仓库训练自己的图像分类数据集(含推理预测)
2023-08-23 13:55:54
14201
21
原创 YOLOv8教程系列:三、K折交叉验证——让你的每一份标注数据都物尽其用(yolov8目标检测+k折交叉验证法)
YOLOv8教程系列:三、K折交叉验证——让你的每一份标注数据都物尽其用(yolov8目标检测+k折交叉验证法)
2023-08-22 16:55:29
6768
20
原创 YOLOv8教程系列:三、使用YOLOv8模型进行自定义数据集半自动标注
YOLOv8教程系列:三、使用YOLOv8模型进行自定义数据集半自动标注
2023-07-31 20:15:24
2679
原创 【深度学习炼丹大杀器——mlrunner初体验(以mmdetection为例)】
【深度学习炼丹大杀器——mlrunner初体验(以mmdetection为例)】自动化炼丹,告别手动运行的烦恼~
2023-06-11 14:37:06
1641
原创 使用vscode远程服务器,让代码在vscode关闭后也在服务器后台运行
使用vscode远程服务器,让代码在vscode关闭后也在服务器后台运行
2023-06-11 12:22:39
20499
10
原创 【解决deepstream错误】deepstream-app: error while loading shared libraries: libgstrtspserver-1.0.so.0
【解决deepstream错误】deepstream-app: error while loading shared libraries: libgstrtspserver-1.0.so.0
2023-05-18 10:15:06
2046
3
原创 【目标检测实用脚本系列】标注图片裁切成boundingbox的小图
【目标检测实用脚本系列】将labelImg标注的xml标签,按标签名建立文件夹,并将对应的裁切小图保存到文件夹中
2023-03-17 15:11:24
641
2
原创 【mmdeploy部署系列】使用Tensorrt加速部署mmpose人体姿态库
【mmdeploy部署系列】使用Tensorrt加速部署mmpose人体姿态库
2023-03-04 17:47:09
2096
2
原创 【边缘端环境配置】英伟达Jetson系列安装pytorch/tensorflow/ml/tensorrt环境(docker一键拉取)
【边缘端环境配置】英伟达Jetson系列安装pytorch/tensorflow/ml/tensorrt环境(docker一键拉取)
2023-03-04 14:49:53
4250
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人