ICCV25! 上交&中科院MambaFusion: 首个SOTA Mamba多模态3D检测

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

今天自动驾驶之心为大家分享上交&中科院ICCV'25中稿的最新工作—MambaFusion!首个SOTA的纯Mamba多模态3D检测。如果您有相关工作需要分享,请在文末联系我们!

自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询

>>自动驾驶前沿信息获取自动驾驶之心知识星球

论文作者 | Hanshi Wang等

编辑 | 自动驾驶之心

论文总结

ICCV 2025 中稿的最新工作!本文首次提出了使用纯 Mamba 模块实现高效密集全局融合,并在相机–LiDAR 多模态 3D 目标检测任务上达到SOTA性能。

现有的LiDAR-Camera多模态融合策略往往难以在计算效率、长程建模能力和完整场景信息保留之间取得平衡;受到状态空间模型和线性注意力的启发,本文尝试利用其线性计算复杂度和长程建模能力来解决这些挑战,但实验表明,简单采用高效线性方法反而因高度信息丢失导致多模态对齐偏差而性能退化。

为此,本文首先设计了一种高度保真 LiDAR 编码,通过在连续空间中对体素进行压缩,有效保留精确的高度信息,显著增强相机与 LiDAR 特征的对齐效果;随后提出了混合 Mamba 模块,利用这些丰富的高度特征同时进行局部和全局上下文学习。整合上述组件后,本方法在 nuScenes 验证集上取得了 75.0 NDS,不仅超越了多种依赖高分辨率输入的顶尖方案,而且在推理速度上也领先于大多数最新方法。

  • 论文标题:Height-Fidelity Dense Global

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值