自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 BEVFormer算法及代码解析

BEVFormer是一种基于Transformer的BEV感知算法,通过多视角相机输入构建BEV特征图。其核心模块包括时空自注意力(TSA)和空间交叉注意力(SCA),分别用于时序特征融合和多视角图像特征投影。算法采用可学习的BEV查询作为初始特征,通过6层编码器迭代优化,最终输出可用于3D检测或分割的BEV特征。关键创新点包括:1)时序对齐模块处理自车运动;2)可变形注意力机制实现高效特征采样;3)多尺度特征融合策略。代码实现中包含了网格掩码数据增强、可学习位置编码等细节设计,为后续BEV研究提供了重要参

2025-10-20 16:16:18 1082

原创 GUPNet原理解析

GUPNet是一种基于单目图像的3D目标检测网络,采用两阶段框架:首先通过2D检测头获取2D框,再通过ROI特征和几何投影预测3D信息。核心创新包括:1)基于小孔成像原理的深度预测模块,引入几何不确定度概念;2)采用Hierarchical Task Learning(HTL)策略,通过评估前置任务状态动态调整当前任务权重。网络输出包含目标类别、2D/3D框等属性,其中3D预测通过热图、偏移量和尺寸回归实现,深度计算结合投影几何和修正值。损失函数设计涵盖热图(Focal Loss)、偏移量(L1 Loss)

2025-10-18 21:59:15 823

原创 LSS原理及代码解析

BEV感知的核心思想是将多路传感器的感知数据转换到统一的BEV空间去提取特征,实现目标检测、语义分割、地图构建等任务,对于相机感知模块,转向BEV空间可带来很大的收益,主要体现在三个方面:目前BEV感知主要出现了3类视图转换模块的方案:IPM(Inverse Perspective Mapping)、Lift-splat和Transformer。本文主要对基于Lift-splat(后文简称LS或LSS)的方案进行解析。LSS是英伟达(NVIDIA)在ECCV2020上发表的文章(Lift,Splat,Sho

2024-12-22 09:48:40 1313

原创 Python 并发编程

python并发编程介绍

2023-03-08 18:39:07 364

转载 释放cuda显存及进程

如何释放cuda显存及进程

2023-02-22 15:02:20 3559

转载 Docker教程及完整讲义(入门级)

Docker教程及完整讲义

2023-02-13 21:56:31 634

转载 nvidia-smi 命令详解

nvidia-smi命令详解

2023-02-13 11:57:22 3779

原创 深度学习中的随机数种子

本文参考网络上对于深度学习中seed函数的讲解,记录一下我对于这个函数的理解。

2023-02-12 22:27:27 9195

转载 Tensorboard的使用 ---- SummaryWriter类(pytorch版)

在进行模型训练时,对训练进行可视化可以帮助我们更直观查看模型训练情况,从而更容易发现问题。本文用到的方法为tensorboard可视化方法。

2023-02-12 11:06:20 8860 2

原创 Git简易指令

Git简易指令

2023-02-11 22:06:34 170

原创 ubuntu22.04安装显卡驱动、CUDA及cudnn

教你如何在ubuntu22.04上安装显卡驱动、CUDA以及cudnn

2023-02-07 22:40:01 5248

原创 目标检测评测简介

目标检测评测目标检测评测简介

2023-02-06 13:29:32 345

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除