Abstract
基于机器学习的自动驾驶系统经常面临安全关键场景的挑战,而这些场景在真实世界的数据中较为罕见,从而阻碍了其大规模部署。虽然增加真实世界训练数据的覆盖范围可以解决这个问题,但代价高昂且存在危险。本研究通过轨迹优化,探索通过修改复杂的真实世界常规场景来生成安全关键驾驶场景。我们提出了ReGentS,该方法通过稳定生成的轨迹并引入启发式方法来避免明显的碰撞和优化问题。我们的方法解决了不现实的分离轨迹和不可避免的碰撞场景,这些场景对训练鲁棒的规划器没有用处。我们还扩展了场景生成框架以处理多达32个智能体的真实世界数据。此外,通过使用可微分模拟器,我们简化了涉及模拟器的基于梯度下降的优化过程,为未来的进展铺平了道路。
代码获取:https://github.com/valeoai/ReGentS
欢迎加入自动驾驶实战群
Introduction
随着机器学习(ML)的快速发展,特别是通过基于神经网络的方法,自动驾驶系统变得越来越精通。然而,其性能在很大程度上依赖于训练数据的覆盖范围,且可能在现实世界数据中很少遇到的安全关键场景下表现不佳。提升分布外场景的泛化能力仍然是ML领域的重要话题。这一挑战阻碍了自动驾驶系统的大规模部署,因为它们必须符合严格的安全标准。一个解决方案是通过收集更多多样化的数据来增强真实世界数据的覆盖范围,例如通过事件数据记录器(EDR)。然而,专门为安全关键场景收集数据是危险的、昂贵的,并且伴随着隐私问题。另一种解决方案是生成这些场景。然而,大多数现有方法基于复杂性有限的合成数据进行基准测试,通常涉及的车辆较少。此外,生成过程往往是无约束的,可能会产生不现实的解决方案(如图1b所示)或对增强基于ML的规划器鲁棒性无用的场景。
在这项工作中,我们介绍了ReGentS,这是一种基于真实世界数据生成更稳定的安全关键驾驶场景的方法。我们研究了现有方法中的一些常见选择,例如引发碰撞的成本。通过专注于KING并在更大规模和更现实的设置下进行重构,结合真实世界数据的模拟器Waymax,我们确定了以下改进领域:(1)可能会生成不现实的摆动轨迹;(2)许多生成的碰撞涉及自车被追尾,而这种碰撞在实际中不可避免,因此对于规划器的训练没有提供有用的边缘案例。我们通过分析的优化过程并添加约束来生成更稳定的轨迹。此外,我们引入了启发式方法以避免明显的碰撞场景。与无约束方法相比,我们的方法在生成的轨迹中体现了更现实的驾驶行为,如图1b和1c所示。
从技术角度看,我们通过单个可微分模拟器实现并简化了设置。这使得可以通过梯度下降直接优化,简化了过程并使其统一且更易扩展。可微分模拟器还避免了可微分代理模拟器与非可微分模拟器(如CARLA)之间的繁重交互,消除了两者之间可能出现的不一致性。
3.Method
3.1 模型假设
每个背景智能体 (i > 0) 的轨迹由一系列动作通过离散化的运动学模型控制:
!
其中 f 是车辆的运动学模型,