CVPR‘25 | Scenario Dreamer:用于生成驾驶仿真环境的矢量化潜在扩散

作者 | 自动驾驶专栏 编辑 | 自动驾驶专栏

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心『扩散模型』技术交流群

本文只做学术分享,如有侵权,联系删文

  • 论文链接:https://arxiv.org/pdf/2503.22496

  • 项目主页:https://princeton-computational-imaging.github.io/scenario-dreamer/

图片

摘要

图片

本文介绍了Scenario Dreamer:用于生成驾驶仿真环境的矢量化潜在扩散。本文引入了Scenario Dreamer,这是一种完全数据驱动的生成仿真器,用于自动驾驶汽车规划,它生成了初始交通场景(包含车道图和智能体边界框)和闭环智能体行为。生成驾驶仿真环境的现有方法将初始交通场景编码为栅格化图像,这需要参数庞大的网络,由于栅格化场景中存在很多空像素,因此该网络会执行不必要的计算。此外,本文发现,采用基于规则的智能体行为的现有方法缺乏多样性和真实性。因此,Scenario Dreamer采用一种新的矢量化潜在扩散模型来生成初始场景,它直接对矢量化场景元素进行操作,并且采用一种自回归Transformer进行数据驱动的智能体行为仿真。Scenario Dreamer还支持通过diffusion inpainting进行场景外推,从而生成无界的仿真环境。大量实验表明,Scenario Dreamer在真实性和效率方面优于现有的生成仿真器:矢量化场景生成基础模型实现了更优的生成质量,与最强大的基线相比,参数减少了大约2倍,生成延迟降低了6倍,GPU训练时间缩短了10倍。本文通过实验表明强化学习规划智能体在Scenario Dreamer环境中比传统的非生成仿真环境更具挑战性,从而证实了其实用性。

图片

主要贡献

图片

本文的贡献总结如下:

1)本文引入了Scenario Dreamer,这是一种用于自动驾驶规划的完全数据驱动生成仿真器。Scenario Dreamer的核心是一种用于初始场景生成的新型矢量化潜在扩散模型,相比于先前使用栅格化场景编码的方法,该扩散模型具有实际优势;

2)本文表明,Scenario Dreamer环境对强化学习规划器具有挑战性,特别是长时间和对抗性驾驶环境。

图片

论文图片和表格

图片

图片

总结

图片

本文提出了Scenario Dreamer,这是一种完全数据驱动的生成仿真器,用于自动驾驶规划器。Scenario Dreamer的核心包括一个初始场景生成器和一个返回条件的多智能体Transformer行为模型。本项工作的一个关键创新之处为矢量化潜在扩散模型,与栅格化场景编码方法相比,它能够实现高效且有效的场景生成。本文希望,Scenario Dreamer能够成为自动驾驶研发中完全数据驱动的生成仿真器的研究基础。

局限性:本文发现,车道的交通灯信号并不总是提供有效的交通逻辑。此外,Scenario Dreamer目前仅生成中心线地图。未来,将计划生成其它道路元素类型(例如路缘、人行横道)。

自动驾驶之心

论文辅导来啦

知识星球交流社区

近4000人的交流社区,近300+自动驾驶公司与科研结构加入!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知(大模型、端到端自动驾驶、世界模型、仿真闭环、3D检测、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图(SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案、大模型,更有行业动态和岗位发布!欢迎加入。

独家专业课程

端到端自动驾驶大模型、VLA、仿真测试、自动驾驶C++、BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、车道线检测、轨迹预测、在线高精地图、世界模型、点云3D目标检测、目标跟踪、Occupancy、CUDA与TensorRT模型部署、大模型与自动驾驶、NeRF、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频

学习官网:www.zdjszx.com

内容概要:本文介绍了一个基于多传感器融合的定位系统设计方案,采用GPS、里程计和电子罗盘作为定位传感器,利用扩展卡尔曼滤波(EKF)算法对多源传感器数据进行融合处理,最终输出目标的滤波后位置信息,并提供了完整的Matlab代码实现。该方法有效提升了定位精度与稳定性,尤其适用于存在单一传感器误差或信号丢失的复杂环境,如自动驾驶、移动采用GPS、里程计和电子罗盘作为定位传感器,EKF作为多传感器的融合算法,最终输出目标的滤波位置(Matlab代码实现)机器人导航等领域。文中详细阐述了各传感器的数据建模方式、状态转移与观测方程构建,以及EKF算法的具体实现步骤,具有较强的工程实践价值。; 适合人群:具备一定Matlab编程基础,熟悉传感器原理和滤波算法的高校研究生、科研人员及从事自动驾驶、机器人导航等相关领域的工程技术人员。; 使用场景及目标:①学习和掌握多传感器融合的基本理论与实现方法;②应用于移动机器人、无人车、无人机等系统的高精度定位与导航开发;③作为EKF算法在实际工程中应用的教学案例或项目参考; 阅读建议:建议读者结合Matlab代码逐行理解算法实现过程,重点关注状态预测与观测更新模块的设计逻辑,可尝试引入真实传感器数据或仿真噪声环境以验证算法鲁棒性,并进一步拓展至UKF、PF等更高级滤波算法的研究与对比。
内容概要:文章围绕智能汽车新一代传感器的发展趋势,重点阐述了BEV(鸟瞰图视角)端到端感知融合架构如何成为智能驾驶感知系统的新范式。传统后融合与前融合方案因信息丢失或算力需求过高难以满足高阶智驾需求,而基于Transformer的BEV融合方案通过统一坐标系下的多源传感器特征融合,在保证感知精度的同时兼顾算力可行性,显著提升复杂场景下的鲁棒性与系统可靠性。此外,文章指出BEV模型落地面临大算力依赖与高数据成本的挑战,提出“数据采集-模型训练-算法迭代-数据反哺”的高效数据闭环体系,通过自动化标注与长尾数据反馈实现算法持续进化,降低对人工标注的依赖,提升数据利用效率。典型企业案例进一步验证了该路径的技术可行性与经济价值。; 适合人群:从事汽车电子、智能驾驶感知算法研发的工程师,以及关注自动驾驶技术趋势的产品经理和技术管理者;具备一定自动驾驶基础知识,希望深入了解BEV架构与数据闭环机制的专业人士。; 使用场景及目标:①理解BEV+Transformer为何成为当前感知融合的主流技术路线;②掌握数据闭环在BEV模型迭代中的关键作用及其工程实现逻辑;③为智能驾驶系统架构设计、传感器选型与算法优化提供决策参考; 阅读建议:本文侧重技术趋势分析与系统级思考,建议结合实际项目背景阅读,重点关注BEV融合逻辑与数据闭环构建方法,并可延伸研究相关企业在舱泊一体等场景的应用实践。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值