论文链接:https://arxiv.org/pdf/2404.06892
团队:迈驰、中科大
论文重点
相比于之前的端到端方法,该论文提出了==“稀疏”==的想法。即以前的方法都是需要BEV信息的,BEV信息是稠密的,包含了全视角的、类别丰富的信息。BEV需要空间和时间开销(这类方法比如UniAD,VAD),因此如果传递其他信息呢?该论文传递的是Transformer中的queries,所以论文名也强调“Query-Centric”。
规划
运动预测
ego query + motion query + map + history
优化
这篇论文参考了VAD。VAD是考虑了3种约束,分别是
- 和障碍物的碰撞约束
- 和boundary的碰撞约束
- 和车道方向的方向约束
这篇论文会对前后左右各个方向的障碍物的风险进行约束,使用focal loss进行loss设计。但是这一部分我不懂。
除此之外,还拿ego query解码了未来状态(速度、加速度、方向等)。但是这个是微分上互相约束的,怎么能解码呢?
测评
测评是在nuS数据集上做的,开环没有意义。