nuPlan新SOTA!清华提出Diffusion Planner:扩散模型重塑自动驾驶路径规划(ICLR'25)...

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

今天自动驾驶之心为大家分享清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室发表于ICLR 2025的最新工作—灵活引导下的基于扩散模型的自动驾驶路径规划Diffusion Planner!如果您有相关工作需要分享,请在文末联系我们!

自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询

>>点击进入→自动驾驶之心扩散模型技术交流群

论文作者 | Yinan Zheng等

编辑 | 自动驾驶之心

d909c106946f24551ff5ec54bacebe04.jpeg

本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。此外,借助扩散模型的引导机制,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。

论文链接:https://arxiv.org/pdf/2501.15564

项目主页:https://zhengyinan-air.github.io/Diffusion-Planner/

背景介绍

自动驾驶规划正朝着更安全、高效的方向发展,但在复杂环境下实现类人驾驶仍具挑战。基于规则的方法虽在工业应用中取得成功,但适应性差,调整成本高;模仿学习能直接学习专家驾驶行为,并随训练数据扩展提升性能。然而,模仿学习方法在多模态行为适应性、泛化能力和驾驶风格灵活调控上仍存挑战,依赖后处理来优化模型输出。

近年来,扩散模型在决策领域得到广泛应用,但在自动驾驶规划中的探索仍有限。现有研究多聚焦于运动预测和场景生成,关注开环性能,而非闭环规划。一些方法尝试将扩散模型应用于规划任务,但仅仅是沿用现有结构或扩展模型参数,缺乏针对性结构设计,导致仍然高度依赖后处理。

为此,我们提出了Diffusion Planner,一种创新的基于扩散模型的自动驾驶规划方法。通过扩散模型强大的数据分布拟合能力,Diffusion Planner能够精准捕捉复杂场景中周车与自车的多模态驾驶行为,并实现周车预测与自车规划的联合建模。同时,基于Transformer的结构设计高效处理复杂场景输入,实现20Hz的高速实时推理。此外,借助灵活的引导机制,模型在部署阶段即可适应不同的驾驶需求。在大规模真实数据集 nuPlan 的闭环评估中,Diffusion Planner取得了SOTA级表现,⼤幅降低了对后处理的依赖,并在额外收集的 200 小时物流小车数据上验证了其在多种驾驶风格下的鲁棒性和迁移能力。

Diffusion Planner 技术细节

Diffusion Planner专为自动驾驶闭环规划设计,具备以下特点:

  • 基于DiT架构融合加噪轨迹与条件信息,推理速度可达20Hz;

  • 联合建模自车与周车的未来轨迹,将运动预测与闭环规划统一为未来轨迹生成;

  • 采用扩散模型的引导机制,实现具有偏好的轨迹生成。

模型结构设计

在自动驾驶中,自车与周围车辆之间的紧密互动使得规划与预测任务必须高度协同。为了应对复杂的交通场景,准确预测邻近车辆的未来轨迹至关重要。这不仅提升了闭环规划模型的能力,还能增强系统的安全性和可控性。我们通过联合建模关键参与者的状态,将运动预测与闭环规划任务统一为一个未来轨迹生成任务。我们希望模型能够同时生成所有关键参与者的未来轨迹,从而实现更加自然的协同行为。

然而,多车交互的复杂场景会产生更加多样的驾驶行为,增加了训练的难度。为此,我们采用了扩散模型的框架进行训练,并基于Diffusion Transformer设计了针对自动驾驶规划的结构

abf0b64276feadc27823ee12f996bf30.png

具体而言,我们考虑了周围车辆的历史信息、道路信息和静态障碍物,设计了简洁的编码器结构用于信息提取,并通过交叉注意力机制与加噪后的自车和周车轨迹进行信息交互。此外,我们还引入了额外的导航信息以及扩散模型特有的加噪步数信息。为了避免模型重复自车历史行为导致闭环性能下降,我们仅考虑自车当前时刻的位置和朝向,并与周车的当前状态一起拼接到加噪轨迹中。通过这种方式,起始状态的引导还能进一步降低模型对未来轨迹生成的难度。

有偏好轨迹生成

基于扩散模型的引导机制,我们可以在模型的测试阶段引入安全,舒适等偏好,同时也可以根据用户需求灵活的改变模型输出的轨迹特性,例如速度特性。此外,不同的偏好可以通过加权求和轻松组合,并且在部署阶段可以灵活选择是否启用,提供更大的灵活性。

b2b228bc191b3e77407b2208dcd5035b.jpeg

实验结果

nuPlan闭环仿真

下图展示了Diffusion Planner与其他自动驾驶规划算法在nuPlan数据集上的表现对比。我们在三个常用测试基准上进行了比较,结果显示Diffusion Planner达到了SOTA性能水平。通过引入现有的后处理模块,算法性能得到了进一步提升,这得益于模型生成的高质量轨迹,为后处理模块提供了更优的初始化参考轨迹。

5fa7afec4be768f87673e2f24a13ebfb.png

此外,我们还对比了现有基于扩散模型的自动驾驶规划算法。与现有方法相比,Diffusion Planner 有效降低了对后处理的依赖,同时实现了更高的推理频率,进一步验证了我们设计结构的有效性。

dd84f1732595a7df99c67f4b24e8962e.jpeg

轨迹生成可视化

为了进一步展示Diffusion Planner在轨迹生成方面的优势,我们选择了狭窄路段的左转场景,并与现有方法的无后处理版本进行了对比,如下图所示。Diffusion Planner生成了高质量的轨迹,不仅准确预测了周围车辆的行为,还生成了平滑的自车规划轨迹,合理地考虑了前车的速度,充分体现了预测与规划任务联合建模以及扩散模型生成的优势。

1bdf10f6f466e7f7a5c01a6b84e0e8a2.png

毫末智行物流小车数据集

我们使用毫末智行收集的约200小时真实世界物流小车配送数据,作为nuPlan数据集的补充,并计划后续开源。与nuPlan数据集中的车辆相比,配送车具有以下特点:尺寸较小,运行速度较低;可以在主干道和自行车道上行驶;与行人和骑行者的交互更为频繁,同时面临不同的行驶规则。通过在该数据集上进行测试,我们发现Diffusion Planner依然保持了最佳表现。相比之下,基于规则或依赖后处理的方法由于其设计存在对nuPlan数据的过拟合问题,导致在新场景中的性能下降。这进一步证明了Diffusion Planner在适应不同驾驶行为方面的鲁棒性

dbeb210740590a751bb8c33c837d0388.png

有偏好轨迹生成案例

为了进一步展示引导机制的有效性,我们挑选了部分场景,从相同起始位置出发,展示了闭环测试结果。红色虚线和空心黄色车代表没有引导的结果,而红色实线和实心黄色车则表示有引导的结果。

79e95b9b00ea2be175a4efec6763e3d3.jpeg

总结

在本文中,我们提出了 Diffusion Planner,一种基于模仿学习的自动驾驶规划方法,充分发挥扩散模型的强大表达能力和灵活的引导机制。我们设计了基于 Diffusion Transformer 的模型架构,联合建模运动预测与规划任务中的多模态数据分布,并利用扩散模型的引导机制,使模型生成的规划行为与目标驾驶风格保持一致。Diffusion Planner 在 nuPlan 数据集及新收集的 200 小时物流车驾驶数据集上取得了 SOTA 级别的闭环性能,并展现出对不同驾驶风格的强大适应性。

① 自动驾驶论文辅导来啦

adbf582c812587994ad16523c4ae4749.jpeg

② 国内首个自动驾驶学习社区

『自动驾驶之心知识星球』近4000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知端到端自动驾驶世界模型仿真闭环2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型,更有行业动态和岗位发布!欢迎扫描加入

20053aaa62bf7c39ab8051c27b38e482.png

 ③全网独家视频课程

端到端自动驾驶、仿真测试、自动驾驶C++、BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、CUDA与TensorRT模型部署大模型与自动驾驶NeRF语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

c0f0f6fdea6c9eccdebd1392237032e3.png

网页端官网:www.zdjszx.com

④【自动驾驶之心】全平台矩阵

252aedb00f4b4def8f39934c5c74f52e.png

### 清华大学扩散模型及相关技术 #### 已知背景 清华大学近年来在人工智能领域取得了显著进展,特别是在生成式模型的研究方面。其中,扩散模型作为一种兴的生成模型,因其强大的数据建模能力和广泛的应用场景而备受关注。 #### 表达能力与算法优化 扩散模型的核心优势在于其能够通过一系列逐步去噪的过程生成高质量的数据样本[^1]。这种模型利用深度神经网络拟合复杂的函数关系,从而有效描述高维数据的分布特性。为了进一步提高效率和性能,研究人员开发了多种改进方法和技术。 #### 参数高效迁移学习 Diff-Tuning 针对扩散模型的迁移学习问题,清华大学提出了一种名为 **Diff-Tuning** 的方法[^4]。这种方法基于对扩散模型逆过程中的遗忘现象的研究,旨在通过调整知识保留和知识再巩固的目标,平衡整个逆过程中的遗忘与保留程度。具体而言,Diff-Tuning 鼓励微调后的模型在去噪链末端保持接近生成数据的预训练知识,同时逐渐丢弃无关噪声部分的知识。 #### 大规模机器人基础模型 RDT 除了理论研究外,清华大学还致力于实际应用的技术突破。例如,在机器人领域,团队构建了一个具有 12 亿参数的大规模扩散模型——RDT (Robotics Diffusion Transformer)[^2]。此模型经过长时间的预训练以及后续的微调阶段,展现了卓越的能力。值得注意的是,该模型依赖于高性能计算设备的支持,如 NVIDIA H100 GPU,并采用了先进的并行化策略以加速训练进程。 #### 自动驾驶规划器 Diffusion Planner 另外一项值得关注的工作是由清华大学智能产业研究院完成的 **Diffusion Planner**,这是一项面向自动驾驶路径规划的任务导向型研究成果[^3]。通过对传统运动规划方法的创改造,结合现代机器学习工具的优势,Diffusion Planner 提供了一套全的解决方案框架,适用于动态环境下的实时决策需求。 #### 模型评估 FlashEval 最后值得一提的是关于如何科学合理地评价这些复杂系统的贡献。为此专门设计出了叫做 **FlashEval** 的型评测机制[^5]。相比传统的随机采样方式来说,它能够在更少样本数量条件下获得同样可靠的结果反馈,极大地节约了时间成本同时也提升了整体流程透明度。 ```python # 示例代码片段展示简单的扩散过程模拟 import numpy as np def add_noise(image, noise_level=0.1): """向图像添加指定强度的高斯白噪音""" noisy_image = image + noise_level * np.random.randn(*image.shape) return np.clip(noisy_image, 0., 1.) def denoise_step(noisy_image, network_output): """执行单步去噪操作""" cleaned_image = noisy_image - network_output return np.clip(cleaned_image, 0., 1.) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值