TrajectoryNAS:一种用于轨迹预测的神经结构搜索

作者 | 自动驾驶专栏  编辑 | 自动驾驶专栏

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心轨迹预测技术交流群

本文只做学术分享,如有侵权,联系删文

374df344c8d92e454f5add52e3d0a5b7.png

  • 论文链接:https://arxiv.org/pdf/2403.11695.pdf

7918c8fb7bdec427e472a815d4495ce6.jpeg

摘要

373bc062ed056d04c0bbab53e00c9e0f.png

本文介绍了TrajectoryNAS:一种用于轨迹预测的神经结构搜索。自动驾驶系统是一项快速发展的技术,其可以实现无人驾驶汽车的量产。轨迹预测是自动驾驶系统的一个关键组成部分,其使汽车能够预测周围目标的运动,从而实现安全导航。由于使用激光雷达点云数据的轨迹预测提供了3D信息,因此其比使用2D图像的轨迹预测表现更好。然而,处理点云数据比2D图像更复杂、更耗时。因此,使用点云数据的最先进的3D轨迹预测存在速度慢和错误预测等问题。本文引入了TrajectoryNAS,这是一种着重于利用点云数据进行轨迹预测的开创性方法。通过利用神经结构搜索(NAS),TrajectoryNAS自动化轨迹预测模型的设计,以凝聚的方式包含目标检测、跟踪和预测。这种方法不仅解决了这些任务之间复杂的相互依赖关系,还强调了轨迹建模中准确性和效率的重要性。通过实证研究,TrajectoryNAS展现了其在提高自动驾驶系统性能方面的有效性,标志着该领域取得了重大进展。实验结果表明,与其它轨迹预测方法相比,TrajectoryNAS在nuScenes数据集上的准确性至少提高了4.8%,延迟至少降低了1.1倍。

519b0af1bd710cf89b448d7b5fe2a63a.jpeg

主要贡献

4aa86e24320e92690a91fe6f1899e6b7.png

本文的贡献总结如下:

1)本文提出了TrajectoryNAS,它是自动驾驶轨迹预测领域中的先驱工作。与先前工作不同,本文方法是首次以端到端的方式实现神经架构搜索(NAS),包含目标检测、跟踪和预测。这种全面集成解决了子任务(例如点云处理、检测和跟踪)之间的相互依赖性所带来的复杂挑战;

2)本文利用了高效的小型数据集。为了满足与神经结构搜索相关的计算要求,本文方法引入了高效的两步过程。首先,本文采用一个小型数据集来加速最优结构的识别。随后,将识别的结构应用于完整的数据集,以确保可扩展性和准确性。这种精简的方法在处理大量数据集时特别有价值;

3)本文设计了开创性的多目标能量函数:本项工作的一个关键创新点是引入一种新的多目标能量函数。该能量函数考虑了目标检测、跟踪、预测和时间约束。通过将这些不同的要素加入一个统一的框架中,本文方法超越了那些通常忽略这些目标之间复杂关系的现有方法。新的能量函数增强了TrajectoryNAS的预测能力,提高了其在现实世界场景中的性能。

bb2fdcc986b7eaf0815da5d0edc146f1.jpeg

论文图片和表格

f9473a3fd35fc6c1a059383a188ebb19.png

97d1953a9669422bf8e7cad4b3a1d413.png

bf4a1d8ed501f456326cb376d32ea619.png

94a164603a66162710c48f867555c2d9.png

d8c04cf2c9ea720e46f1afce497b9183.png

c92ed87c79632261add0dd14fe026d94.png

b1ff412bb4755ead22eaab322deb2215.png

de4e27cb4d7261319d9bfe6afe4004a4.png

ad1fbdab383f98602f1503e901a0969f.jpeg

总结

1a63b55dbcbd3235411a7f45620da40f.png

本文提出了TrajectoryNAS,这是一种自动模型设计方法,其显著增强了自动驾驶的3D轨迹预测。通过在考虑关键性能指标的同时对速度和准确性进行优化,TrajectoryNAS在nuScenes数据集上的准确性至少提高了4.8%,延迟至少降低了1.1倍,其优于现有方法。

投稿作者为『自动驾驶之心知识星球』特邀嘉宾,欢迎加入交流!

① 全网独家视频课程

BEV感知、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、cuda与TensorRT模型部署大模型与自动驾驶Nerf语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

83df917b3984e6128875b816de20cf9e.png

网页端官网:www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业,近2700人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型、端到端等,更有行业动态和岗位发布!欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频

8b9e8712f48c85e7913e0a01e33ac399.png

③【自动驾驶之心】技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦2D/3D目标检测、语义分割、车道线检测、目标跟踪、BEV感知、多模态感知、Occupancy、多传感器融合、transformer、大模型、在线地图、点云处理、端到端自动驾驶、SLAM与高精地图、深度估计、轨迹预测、NeRF、Gaussian Splatting、规划控制、模型部署落地、cuda加速、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向。扫码添加汽车人助理微信邀请入群,备注:学校/公司+方向+昵称(快速入群方式)

a24311c77ad1a87ec052747642d4a4c4.jpeg

④【自动驾驶之心】平台矩阵,欢迎联系我们!

9bb6d9de5e24c003b2f1f72b733ad3b5.jpeg

一种基于有效视角点方法的相机位姿估计MATLAB实现方案 该算法通过建立三维空间点与二维图像点之间的几何对应关系,实现相机外部参数的精确求解。其核心原理在于将三维控制点表示为四个虚拟基点的加权组合,从而将非线性优化问题转化为线性方程组的求解过程。 具体实现步骤包含以下关键环节:首先对输入的三维世界坐标点进行归一化预处理,以提升数值计算的稳定性。随后构建包含四个虚拟基点的参考坐标系,并通过奇异值分解确定各三维点在该基坐标系下的齐次坐标表示。接下来建立二维图像点与三维基坐标之间的投影方程,形成线性约束系统。通过求解该线性系统获得虚拟基点在相机坐标系下的初步坐标估计。 在获得基础解后,需执行高斯-牛顿迭代优化以进一步提高估计精度。该过程通过最小化重投影误差来优化相机旋转矩阵和平移向量。最终输出包含完整的相机外参矩阵,其中旋转部分采用正交化处理确保满足旋转矩阵的约束条件。 该实现方案特别注重数值稳定性处理,包括适当的坐标缩放、矩阵条件数检测以及迭代收敛判断机制。算法能够有效处理噪声干扰下的位姿估计问题,为计算机视觉中的三维重建、目标跟踪等应用提供可靠的技术基础。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值