自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小小老大MUTA的博客

目标检测,多模态融合

  • 博客(133)
  • 收藏
  • 关注

原创 基于双目相机的机械臂抓取--预备知识

基于FoundationPose  这篇论文对 以“机械臂抓取” 为目的 的 “物体姿态估计和跟踪” 相关知识学习

2025-06-11 10:12:58 387

原创 空间注意力机制

空间注意力机制原理和代码

2025-06-10 20:29:55 126

原创 通道注意力机制

通道注意力机制原理和代码

2025-06-10 19:53:27 293

原创 (1)深度学习基础知识(八股)——常用名词解释

深度学习的入门基础知识,面试八股

2025-05-22 21:56:11 1496

原创 Ultralytics/YOLO 结果图解释

学会看常用的目标检测指标结果图

2025-05-22 14:30:08 630

原创 Ultralytics代码将终端改为多模态的结果展示

Ultralytics代码将终端改为多模态的结果展示

2025-05-18 18:46:32 741

原创 ultalytics代码中模型接收多层输入的处理

ultalytics代码中模型是怎么接 收多层输入 传入模型进行加载?

2025-05-15 10:17:24 375

原创 ultralytics中tasks.py---parse_model函数解析

ultralytics中怎么通过yaml文件生成模块组成完整模型?

2025-05-14 22:40:27 593

原创 Mamba-yolo移植到ultralytics代码的全过程

将mamba-yolo代码移植到原始ultralytics上,了解如何在ultralytics代码的基础上设计自己的网络模型

2025-05-14 13:57:28 1024

原创 ultralytics代码中训练全流程

以yolov5为例,记录模型训练从进入模型到反向传播的全流程

2025-05-12 18:05:40 822

原创 以yolov5s模型为例解析ultralytics中模型构建代码

ultralytics中模型如何构建的

2025-05-12 17:56:41 1084

原创 Ultralytics代码修改dataset和dataloader适用于自己的数据集

将YOLO中的dataset修改为多模态,但是只传入一个模态进模型

2025-05-12 09:57:30 1216

原创 *args 和 **kwargs

*args 和 **kwargs

2025-05-07 18:25:19 211

原创 Ultralytics中的YOLODataset和BaseDataset

Ultralytics中的YOLODataset和BaseDataset关系,以及数据打包方式

2025-05-07 16:10:23 735

原创 AUTODL关闭了程序内存依然占满怎么办

AUTODL关闭了程序内存依然占满解决方案

2025-04-23 20:29:05 197

原创 coco128数据集格式

coco128数据集格式

2025-04-15 16:11:36 342

原创 Vision Mamba修改为自己的目标检测数据集

设计自己的数据打包样式

2025-04-13 17:13:45 994

原创 YOLOX 检测头以及后处理

YOLOX—yolo_head.py文件解读,检测头+后处理+损失计算

2025-04-05 15:39:55 900

原创 Vision Mamba代码解读——模型篇

Vision Mamba模型构建的代码梳理

2025-04-01 12:18:01 1297

原创 《Fall-Mamba: A Multimodal Fusion and Masked Mamba-based Approach for Fall Detection》论文精读笔记

《Fall-Mamba: A Multimodal Fusion and Masked Mamba-based Approach for Fall Detection》视频+音频多模态融合 跌倒检测 论文精读笔记

2025-03-31 16:08:47 1162

原创 Vision Mamba复现(环境配置)

Vision Mamba环境配置,成功运行

2025-03-31 16:07:53 870

原创 《Fusion-Mamba for Cross-modality Object Detection》论文精读笔记

《Fusion-Mamba for Cross-modality Object Detection》基于Mamba的光学+红外融合方法——Fusion Mamba论文精读笔记

2025-03-26 10:44:05 1177 1

原创 《DepMamba : Progressive Fusion Mamba for Mutilmodal Depression Detection》论文精读笔记

《DepMamba : Progressive Fusion Mamba for Mutilmodal Depression Detection》 音频+视频多模态融合抑郁症检测 论文精读笔记

2025-03-26 10:43:40 908

原创 工厂函数(Factory Function)

工厂函数以及常用的partial应用

2025-03-24 16:05:00 218

原创 官方CenterNet——目标检测代码复现

官方CenterNet——目标检测代码复现,只是让代码跑起来,不包含其他参数修改

2025-03-23 16:52:00 941

原创 训练过程中实时显示 epoch 进度和动态指标

训练过程中实时显示 epoch 进度和动态指标

2025-03-21 18:33:33 291

原创 COMO: Cross-Mamba Interaction and Offset-Guided Fusion for Multimodal Object Detection 论文精读笔记

COMO: Cross-Mamba Interaction and Offset-Guided Fusion for Multimodal Object Detection 多模态融合目标检测 论文翻译与精读笔记

2025-03-20 17:54:51 1151

原创 Vision Mamba论文精读笔记

《Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model 》论文翻译详解

2025-03-13 19:36:25 1681 1

原创 学习率调度器——stepLR和MultiStepLR

pytorch中常用的学习率调度器——stepLR 和 MultistepLR

2025-03-12 15:11:51 679

原创 LeeCode经典150题——哈希表

leecode——哈希表专题

2025-03-10 23:06:12 634

原创 DETR代码详解——数据加载篇

DETR代码中,使用COCO数据集,是怎么构建传入的训练数据以及数据加载器

2025-03-06 14:30:55 252

原创 CenterNet详解——数据加载代码篇

CenterNet代码中是怎么准备训练数据的?格式是什么?

2025-03-05 20:51:08 1127

原创 函数不return也能修改传入参数?可变对象和不可变对象

什么情况函数没有返回值也能对传入参数进行修改赋值?

2025-03-05 14:47:56 243

原创 python中的__call__方法

python中的__call__方法

2025-03-04 11:22:24 197

原创 Xavier 均匀分布初始化方法(Xavier Uniform Initialization)

确保模型中的可学习参数被初始化为合理的值,提升训练初期速度

2025-03-03 15:27:08 562

原创 深度学习网络框架中Registry注册机制的使用

python中的Registry注册机制在深度学习中的使用

2025-02-27 14:42:42 342

原创 python中的装饰器

python中的装饰器的使用方法

2025-02-26 15:33:18 744

原创 __all__ 和 __inject__操作

__all__ 和 __inject__操作

2025-02-25 11:18:19 257

原创 SCANet代码解读

RGB -声呐跟踪论文《RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker》的源码解读

2025-02-19 20:15:49 703

原创 ViT | Vision Transformer 回顾(理论+代码)

ViT的快速回顾,包含理论和代码

2025-02-19 14:26:50 789

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除