- 博客(9)
- 收藏
- 关注
原创 【学习笔记】SparseLIF: High-Performance SparseLiDAR-Camera Fusion for 3D Object Detection
稀疏三维检测器由于具有低延迟且不需要密集的BEV特征构建的特点,近期收到了极大的关注。然而,稀疏检测器的性能始终未能超越密集检测器。和,并提出了一种高性能的全稀疏检测器,以弥合稀疏与密集检测器之间的效率差距。
2024-12-12 11:29:16
931
原创 图像-LIDAR融合方式 一些论文
由于基于激光雷达的检测方法比基于相机的方法性能要好得多,目前最先进的方法主要是基于激光雷达的三维目标检测,即主要通过激光雷达管道进行检测,将图像信息整合到激光雷达检测管道的不同阶段,来弥补激光雷达的不足。鉴于基于激光雷达和基于摄像机的检测系统的复杂性,将两种方式结合在一起不可避免会带来额外的计算开销和推理延迟。故如何有效地将相机和激光雷达信息融合在一起是一个挑战。此外的一大挑战是图像和点云的配准问题。
2024-12-10 15:43:24
3195
原创 【学习笔记】TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers
首先是TransFusion的总体结构现有的基于硬关联的图像-点云融合方法很容易受到和的影响,这是因为在点云稀疏的部分,硬关联只能获取和点云数量一样少的像素数量,浪费了了高分辨率图像纹理和丰富语义信息的优势,更不用说还存在配准不佳,点云完全落在对应像素之外的情况。文章提出的TransFusion由特征提取主干和基于Transformer解码器的检测头组成,实现图像和点云的软关联,模型可以自行选择图像中提取的特征部分。下图是一个恶劣图像条件和由于点云的稀疏导致图像特征浪费的例子。
2024-11-26 20:17:21
1159
原创 Transformer学习笔记
这篇笔记是学习了b站视频 Transformer最通俗讲解 后的个人笔记Attention is all you need论文链接首先需要明确向量点积的意义是反应两个向量的相似程度以及Transformer的整体结构: e.g.输入:你是谁 电脑无法直接理解单词/汉字,需要先转换为电脑看的懂的向量形式,这是input embedding(输入嵌入)做的事: 单是将词转换成向量还不够,因为每个词其实还包含位置信息,同一个词出现在不同位置的含义也不同,例如:故需要引入位置编码:
2024-11-23 21:32:14
661
原创 Chapter4 程序流程结构
断断续续看这一章看了好久,这两周事情太多了,需要加快速度c++的三种基本程序运行结构:顺序结构,选择结构,循环结构。
2024-04-10 16:53:14
1442
1
原创 C++赛博笔记 Chapter2 数据类型
2024.3.18,上午看文献,下午的时间看完了第一章和第二章数据类型。c++在创建一个变量或常量时必须申明其数据类型,否则无法为变量分配内存。数据类型存在意义就是为变量分配合适的内存空间。
2024-03-18 17:32:15
1701
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅