自动驾驶一周论文精选!端到端、VLA、感知、决策等~

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近30个方向学习路线

最近自动驾驶相关的论文挺多的,自动驾驶之心汇总了近期还不错的一些工作。涉及端到端、感知、VLM、BenchMark等多个领域,更多内容欢迎加入自动驾驶之心知识星球获取~

自动驾驶之心知识星球截止到目前已经完成了产业、学术、求职、问答交流等多个领域的闭环。星球内部为大家梳理了近40+技术路线,无论你是咨询行业应用、还是要找最新的VLA benchmark、综述和学习入门路线,都能极大缩短检索时间。星球还为大家邀请了数十位自动驾驶领域嘉宾,都是活跃在一线产业界和工业界的大佬(经常出现的顶会和各类访谈中哦)。欢迎随时提问,他们将会为大家答疑解惑。

端到端自动驾驶

  1. 中科大GMF-Drive:基于门控Mamba融合与空间感知BEV表征的端到端自动驾驶
    论文标题:GMF-Drive: Gated Mamba Fusion with Spatial-Aware BEV Representation for End-to-End Autonomous Driving

  2. ME³-BEV:清华&比亚迪提出Mamba增强的BEV感知端到端自动驾驶深度强化学习框架
    论文标题:ME3-BEV: Mamba-Enhanced Deep Reinforcement Learning for End-to-End Autonomous Driving with BEV-Perception

  3. 慕尼黑工业大学提出SpaRC-AD:面向端到端自动驾驶的RV融合基准框架
    论文标题:SpaRC-AD: A Baseline for Radar-Camera Fusion in End-to-End Autonomous Driving

  4. 博世联合清华等提出IRL-VLA:免仿真器强化学习训练VLA驾驶大模型,CVPR亚军方案!
    论文标题:IRL-VLA: Training an Vision-Language-Action Policy via Reward World Model

  5. 新加坡国立大学、清华大学与小米汽车团队提出EvaDrive:基于进化对抗策略优化的端到端自动驾驶闭环决策框架
    论文标题:EvaDrive: Evolutionary Adversarial Policy Optimization for End-to-End Autonomous Driving

自动驾驶感知 & VLM

  1. VISTA:基于视觉语言模型与少样本学习的动态环境驾驶员注意力时空预测及自然语言解释
    论文标题:VISTA: Vision-Language Imitation of Situational Thinking and Attention for Human-Like Driver Focus in Dynamic Environments

  2. 安全关键型自动驾驶的渐进式BEV感知技术:A Comprehensive Survey
    论文标题:Progressive Bird's Eye View Perception for Safety-Critical Autonomous Driving: A Comprehensive Survey

  3. CBDES MoE:面向自动驾驶功能模块的分层解耦专家混合模型——清华团队提出首个模块级动态路由架构
    论文标题:CBDES MoE: Hierarchically Decoupled Mixture-of-Experts for Functional Modules in Autonomous Driving

  4. 清华团队提出基于特征图质量评分的自动驾驶模型解耦式功能评估
    论文标题:Decoupled Functional Evaluation of Autonomous Driving Models via Feature Map Quality Scoring

  5. 加拿大温莎大学与北海道大学提出RMT-PPAD:基于Transformer与门控适配器的实时多任务驾驶全景感知模型
    论文标题:RMT-PPAD: Real-time Multi-task Learning for Panoptic Perception in Autonomous Driving

  6. 慕尼黑工业大学提出 Dream-to-Recon:基于扩散-深度蒸馏的单目图像三维场景重建
    论文标题:Dream-to-Recon: Monocular 3D Reconstruction with Diffusion-Depth Distillation from Single Images

  7. 清华大学提出VLM-3D:面向开放世界的端到端视觉语言模型驱动3D感知
    论文标题:VLM-3D:End-to-End Vision-Language Models for Open-World 3D Perception

  8. 马来亚大学团队发布视觉推理权威综述:提出统一框架,解析关系/符号/时序/因果/常识五大推理范式
    论文标题:Reasoning in Computer Vision: Taxonomy, Models, Tasks, and Methodologies

决策规控领域

  1. 代尔夫特理工大学:交互感知自动驾驶控制器评测
    论文标题:Towards Human-Centric Evaluation of Interaction-Aware Automated Vehicle Controllers: A Framework and Case Study

  2. 主动推理:消除奖励依赖的自主智能体决策框架——IBM研究院提出LLM-AIF融合架构
    论文标题:The Missing Reward: Active Inference in the Era of Experience

仿真测试领域

  1. 北大团队提出ReconDreamer-RL:基于扩散场景重建的强化学习框架
    论文标题:ReconDreamer-RL: Enhancing Reinforcement Learning via Diffusion-based Scene Reconstruction

数据集

  1. STRIDE-QA:面向城市驾驶场景时空推理的大规模视觉问答数据集
    论文标题:STRIDE-QA: Visual Question Answering Dataset for Spatiotemporal Reasoning in Urban Driving Scenes

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值