世界模型再进化！博世AdaWM：自适应世界模型规划新SOTA~

最新推荐文章于 2025-09-03 22:36:44 发布

转载最新推荐文章于 2025-09-03 22:36:44 发布 · 368 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247651533&idx=2&sn=57b421f591a9fc1d9148f33753834620&chksm=cf19cc1c60de52cdd690cea344d07f23605edfa8c17ef7bb7a5c5236fd1bb5781053e9829bcc&scene=126&sessionid=0

编辑 | 自动驾驶专栏

点击下方卡片，关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心『世界模型』技术交流群

本文只做学术分享，如有侵权，联系删文

论文链接：https://arxiv.org/pdf/2501.13072

摘要

本文介绍了AdaWM：基于自适应世界模型的自动驾驶规划。基于世界模型的强化学习（RL）已经成为一种有前景的自动驾驶方法，它学习潜在动态模型并且用其训练规划策略。为了加快学习过程，通常使用预训练-微调范式，其中在线RL由预训练模型和离线学习的策略来初始化。然而，在RL中朴素地执行这类初始化可能会导致新任务中的在线交互期间性能急剧下降。为了应对这一挑战，本文首先分析了性能下降问题，并且确定了两个主要根本原因：规划策略的不匹配和动态模型的不匹配（由分布偏移导致）。本文进一步分析了这些因素对微调过程中性能下降的影响，研究结果表明，微调策略的选择在缓解这些影响方面发挥着关键作用。然后，本文引入了AdaWM，这是一种基于自适应世界模型的规划方法，其具有两个关键步骤：（a）不匹配识别，它量化了不匹配并且告知微调策略；（b）对齐驱动的微调，它使用高效的低秩更新选择性地更新策略或者模型。本文在具有挑战性的CARLA驾驶任务上进行实验，结果表明，AdaWM显著地改进了微调过程，使自动驾驶系统的性能更为鲁棒和高效。

主要贡献

本文的主要贡献总结如下：

1）本文量化了微调过程中观测到的性能差距，并且确定了两个主要根本原因：（1）动态模型不匹配；（2）策略不匹配。然后，评估每种原因对微调性能的相应影响；

2）本文引入了AdaWM，这是一种基于自适应世界模型的自动驾驶规划方法，它通过两个关键步骤实现了有效的微调：（1）不匹配识别；（2）对齐驱动的微调。此外，AdaWM分别为动态模型和策略引入了高效的更新方法；

3）本文在具有挑战性的CARLA环境中的多个任务上验证了AdaWM，展现了它在路径成功率（SR）和碰撞时间（TTC）方面实现卓越性能的能力。实验结果表明，AdaWM有效地缓解了各种新任务的性能下降问题，证实了识别和解决微调过程中不匹配的重要性。

论文图片和表格

总结

本项工作提出了AdaWM，这是一种基于自适应世界模型的规划方法，它缓解了自动驾驶中基于世界模型的强化学习（RL）的性能下降问题。根据理论分析，本文确定了导致性能下降的两个主要原因：动态模型不匹配和策略不匹配。本文提出了具有两个核心组件的AdaWM：不匹配识别和对齐驱动的微调。AdaWM评估了性能下降的主要来源，并且根据识别的不匹配对动态模型或者策略应用选择性低秩更新。在CARLA上的大量实验表明，AdaWM显著地提高了路径成功率和碰撞时间，验证了其有效性。本项工作强调了在解决具有挑战性的现实世界任务时选择高效且鲁棒的微调策略的重要性。未来研究存在若干条有前景的途径。首先，探索将AdaWM应用于自动驾驶以外的其它领域能够扩大其适用性。此外，将AdaWM扩展到考虑智能体之间交互的多智能体环境中，可以进一步提高其在复杂现实世界环境中的鲁棒性。

① 2025中国国际新能源技术展会

自动驾驶之心联合主办中国国际新能源汽车技术、零部件及服务展会。展会将于2025年2月21日至24日在北京新国展二期举行，展览面积达到2万平方米，预计吸引来自世界各地的400多家参展商和2万名专业观众。作为新能源汽车领域的专业展，它将全面展示新能源汽车行业的最新成果和发展趋势，同期围绕个各关键板块举办论坛，欢迎报名参加。

② 国内首个自动驾驶学习社区

『自动驾驶之心知识星球』近4000人的交流社区，已得到大多数自动驾驶公司的认可！涉及30+自动驾驶技术栈学习路线，从0到一带你入门自动驾驶感知（端到端自动驾驶、世界模型、仿真闭环、2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪）、自动驾驶定位建图（SLAM、高精地图、局部在线地图）、自动驾驶规划控制/轨迹预测等领域技术方案、大模型，更有行业动态和岗位发布！欢迎扫描加入

③全网独家视频课程

端到端自动驾驶、仿真测试、自动驾驶C++、BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、车道线检测、轨迹预测、在线高精地图、世界模型、点云3D目标检测、目标跟踪、Occupancy、CUDA与TensorRT模型部署、大模型与自动驾驶、NeRF、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频（扫码即可学习）