自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 IS-FUSION: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection

此外,与最近的一些多模态检测工作(如FocalFormer3D[9]、SparseFusion[66]和CMT[69])相比,IS-FUSION表现出了优越的性能,在mAP方面分别比它们高出1.4%、1.0%和1.0%。这突出了实例表示的关键作用。在表3 (e)中,我们的完整模型同时使用HSF和IGF,获得了72.8% mAP和74.0% NDS的最佳性能,显示了实例-场景协同的效果。然而,BEV表示中的对象通常具有较小的尺寸,并且相关的点云上下文本质上是稀疏的,这给可靠的3D感知带来了巨大的挑战。

2025-06-08 20:36:49 561 3

原创 SGDet3D: Semantics and Geometry Fusion for 3D Object Detection Using 4D Radar and Camera

4D毫米波雷达近年来作为一种新兴的自动驾驶传感器备受关注。然而,现有的4D雷达和摄像机融合模型往往无法充分利用每种模态内的互补信息,并且缺乏深入的跨模态交互。针对该问题,该文提出一种新的四维雷达与摄像机融合的三维目标检测方法--SGDet 3D.具体地说,我们首先引入了一个双分支融合模块,该模块采用几何深度补全和语义雷达PillarNet来综合利用每个模态内的几何和语义信息。

2025-06-08 19:25:09 1878

原创 RCDFNet: A 4-D Radar and Camera Dual-LevelFusion Network for 3D Object Detection

四维雷达作为一种先进的车辆传感器,提供比毫米波雷达更密集的点云和高程信息,使其成为自动驾驶的重要传感器。最近,四维雷达和摄像头的融合已经成为自动驾驶感知系统中LiDAR的可行替代方案。然而,现有的融合方法还没有完全实现这两种方式提供的互补优势的潜力。为了解决这一限制,我们的研究提出了RCDFNet,这是一种用于使用4-D雷达和相机进行3D目标检测的双层融合网络。具体来说,我们首先利用从4-D雷达的几何信息提取语义图像特征的透视图,产生伪相机下的鸟瞰图的功能。

2025-06-07 20:18:46 789

原创 RLNet: Adaptive Fusion of 4D Radar and Lidarfor 3D Object Detection

近年来,基于激光雷达的三维目标检测技术取得了长足的发展,已成为自主车辆的主流配置。然而,由于激光雷达的波长短和能量发射的限制,在恶劣天气或长距离目标检测的情况下,激光雷达会经历实质性的性能下降。4D毫米波雷达能够提供类似于激光雷达的3D点云,在恶劣天气条件下具有更强的鲁棒性。然而,由于测量的高稀疏性和闪烁性质,仅使用4D雷达的3D对象检测不太令人满意。为此,本文提出了一种新的三维目标检测方法RLNet。该方法通过自适应特征融合将四维雷达和激光雷达有效地结合起来。

2025-06-05 21:34:22 1148

原创 MutualForce: Mutual-Aware Enhancement for 4DRadar-LiDAR 3D Object Detection

雷达和LiDAR由于能够提供丰富的结构信息,并且雷达在恶劣天气下具有很高的鲁棒性,因此在自动驾驶和机器人领域得到了广泛的应用。最近的研究突出了融合雷达和LiDAR点云的有效性。然而,由于模态不对准和特征提取过程中的信息丢失,仍然存在挑战。针对该问题,该文提出了一种4D雷达LiDAR框架,以增强它们的表示。首先,利用雷达的指示特征来指导雷达和LiDAR几何特征的学习。然后,利用LiDAR的形状信息丰富雷达BEV特征,以弥补其稀疏性。

2025-06-03 22:40:12 604

原创 CaDDn-Categorical Depth Distribution Network for Monocular 3D Object Detection

单目3D目标检测是自动驾驶车辆的关键问题,因为与典型的多传感器系统相比,它提供了一种配置简单的解决方案。单目3D检测的主要挑战在于准确预测物体深度,由于缺乏直接的距离测量,因此必须从物体和场景线索中推断出物体深度。许多方法试图直接估计深度以辅助3D检测,但由于深度不准确而表现出有限的性能。我们提出的解决方案,分类深度分布网络(CaDDN),使用每个像素的预测分类深度分布,将丰富的上下文特征信息投影到3D空间中的适当深度间隔。然后,我们使用计算效率的鸟瞰图投影和单级检测器来产生最终的输出检测。

2025-05-20 19:21:21 2007

原创 GraphAlign:Enhancing Accurate Feature Alignment by Graph matching forMulti-Modal 3D Object Detection

LiDAR和相机是用于自动驾驶中的3D物体检测的互补传感器。然而,点云与图像之间的非自然交互是一个具有挑战性的问题,关键在于如何进行异构模态的特征对齐。目前,许多方法仅通过投影标定实现特征对准,没有考虑传感器间坐标转换精度误差的问题,导致对准效果不理想。本文提出了一种基于图匹配的特征对齐策略GraphAlign。具体地,我们在图像分支中融合来自语义分割编码器的图像特征,并且在LiDAR分支中融合来自3D稀疏CNN的点云特征。为了节省计算量,我们通过计算划分为点云特征的子空间内的欧氏距离来构造最近邻关系。

2025-05-16 22:13:05 2088

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除