论文链接:https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal_Network_for_Motion_Prediction_CVPR_2020_paper.pdf
精读】FANG L, JIANG Q, SHI J, et al., 2020. TPNet: Trajectory Proposal Network for Motion Prediction[C/OL]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA: IEEE: 6796-6805[2022-08-22]. https://ieeexplore.ieee.org/document/9156890/. DOI:10.1109/CVPR42600.2020.00683.TPNet:运动预测的轨迹建议网络
Abstract
对周围交通主体(例如行人、车辆和骑自行车的人)进行准确的运动预测对于自动驾驶至关重要。最近的数据驱动运动预测方法试图学习从大量轨迹数据中直接回归确切的未来位置或其分布。然而,这些方法仍然难以提供多模式预测以及整合交通规则和可移动区域等物理约束。在这项工作中,我们提出了一种新颖的两阶段运动预测框架,即轨迹提议网络(TPNet)。 ==TPNet 首先生成一组候选的未来轨迹作为假设提议,然后通过对满足物理约束的提议进行分类和细化来做出最终预测。==通过指导建议生成过程,可以实现安全和多模式的预测。因此,该框架有效地减轻了运动预测问题的复杂性,同时确保了多模态输出。在四个大规模轨迹预测数据集(即 ETH、UCY、Apollo 和 Argoverse 数据集)上的实验表明,TPNet 在数量和质量上都达到了最先进的结果。 1
Introduction
预测周围交通主体(例如车辆、行人和骑自行车的人)的运动对于自动驾驶系统做出信息丰富且安全的决策至关重要。交通代理的行为本质上是多模态的,其中可能有多个合理的意图来确定他们的未来路径。如图 1 所示,当仅接收到有限数量的观测值时,在这种情况下,绿色的车辆 1 可以右转或直行。此外,交通代理人的移动不仅取决于他们的意图,而且还受到附近交通规则(例如可能的可移动区域)的规则化。例如,车辆应在道路上行驶,并且行人应在人行道或人行横道上行走。因此,可靠的运动预测应该涉及代理先前轨迹的建模以及目标的交通限制。确保安全和多模态预测对于自动驾驶系统至关重要。

运动预测的早期工作通过利用基于卡尔曼滤波器的动态模型 [5, 6] 或高斯混合模型 [9] 等来考虑时间序列预测任务。然而,这些模型对观测噪声非常敏感,并且由于建模主体意图的失败,对于长期预测变得不可靠。最近,已经开发了许多基于深度神经网络的数据驱动运动预测方法 [1, 11, 13, 25, 31, 39, 42, 44, 48]。他们中的大多数人试图**通过从大量轨迹数据中直接回归确切的未来位置或其分布来学习运动模式。**多模态预测是通过从预测分布中采样生成的 [25,49,28]。然而,**当不同意图的未来位置分布很大(例如左转和右转)时,数据驱动的方法很难提供合理的多模式预测。**为了进一步确保预测符合交通规则,环境信息通常被编码为语义图,然后输入神经网络[10, 4]。然而,这些端到端的深度网络缺乏使输出预测严格遵循交通规则或语义图的安全保障,同时也难以有效地结合周围的物理约束。
在这项工作中,我们提出了一种称为轨迹提议网络 (TPNet) 的新型两阶段框架,以更好地处理多模态运动预测和交通约束。**在第一阶段,TPNet 预测一个粗略的未来终点位置以减少轨迹搜索空间,然后基于预测的终点生成假设作为一组可能的未来轨迹建议。在第二阶段,TP Net对proposal进行分类和细化,然后输出得分最高的proposal作为最终预测。**可以在第一阶段产生具有不同意图的提案,以实现多样化的多模态预测。利用可移动区域约束等先验知识过滤提案结果,使该模块更加有效和透明。大量的实验结果表明,提出和细化未来轨迹使得运动预测比直接回归未来位置的预测更准确。
本文的贡献总结如下:1)我们提出了一个针对车辆和行人的统一的两阶段运动预测框架。 2)该框架可以在提案生成过程中结合先验知识,以确保通过多模式预测进行预测,其中考虑了代理的多种意图,以及交通规则和条件的遵守。 3) 我们在最近的大规模轨迹预测数据集 ETH [35]、UCY [27]、ApolloScape [32] 和 Argoverse [8] 上取得了最先进的结果。
Related work
运动预测方法大致可以分为两类,经典方法和基于深度学习的方法。**大多数经典的基于运动的算法使用运动学方程来模拟代理的运动,并预测车辆的未来位置和机动。这些方法的综合概述可以在 [26, 37] 中找到。**对于未来的位置预测,已经部署了多项式拟合[16]、高斯过程[23、43]、高斯混合模型[9]等统计模型。基于卡尔曼滤波器的动态模型 [5, 6] 也被广泛用于运动预测。对于机动识别,贝叶斯网络 [41]、隐马尔可夫模型 [9, 23]、SVM [3, 33]、随机森林分类器 [40] 等模型得到了广泛的探索。他们中的一些

论文提出了一种两阶段运动预测框架——轨迹提议网络(TPNet),用于处理自动驾驶中的多模态预测和交通约束。TPNet首先生成候选的未来轨迹,然后进行分类和细化以确保安全和多模态预测。实验在多个数据集上展示了TPNet的优越性能,特别是在提供多样化预测和遵循交通规则方面。
最低0.47元/天 解锁文章
1661

被折叠的 条评论
为什么被折叠?



