上交Int2Planner:集成预测和规划的意图多模态运动规划器

部署运行你感兴趣的模型镜像

编辑 | 自动驾驶专栏

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心运动规划技术交流群

本文只做学术分享,如有侵权,联系删文

841c21e0cfc07db767812bb169450ebe.png

  • 论文链接:https://arxiv.org/pdf/2501.12799

  • 代码链接:https://github.com/cxlz/Int2Planner

0752a0ddd9b14b8c6f29359074827292.jpeg

摘要

94fd031046ed2e950d92b7bc7accad64.png

本文介绍了Int2Planner:用于集成预测和规划的基于意图的多模态运动规划器。运动规划是自动驾驶中的一个关键模块,其主要挑战是与其他参与者的交互导致的不确定性。由于大多数先前方法将预测和规划作为单独的任务,因此难以建模这些交互。此外,由于路径将自车导航到预定义的目的地,它为自车提供了相对稳定的意图,并且有助于约束不确定性。在此基础上,本文构建了基于意图的集成运动规划器Int2Planner,它实现了多模态规划和预测。Int2Planner利用了自车的路径意图点(而不是静态意图点),并且为每个意图点生成相应的规划轨迹,以促进多模态规划。在私有数据集和公开nuPlan基准上的实验证明了路径意图点的有效性,并且Int2Planner实现了最先进的性能。本文还将其部署在现实世界车辆上,并且在城市地区进行了数百公里的自动驾驶测试。这进一步验证了Int2Planner能够与交通环境持续交互。

7da03095de6aedd559dfec45cc246f69.jpeg

主要贡献

3724b5a4688294c4bb16b75743b1c77b.png

本文的主要贡献总结如下:

1)本文开发了一种新的规划模型Int2Planner,它利用路径意图点来处理多模态规划的不确定性。它将预测和规划结合到一个联合模型中,以实现自车和周围智能体之间的交互;

2)本文提出了从路径中采样意图点(而不是静态意图点)来表示自车的潜在意图。本文为每个意图点生成规划轨迹,以实现多模态规划;

3)本文将为运动规划任务发布一个新的数据集,并且在私有数据集和公开nuPlan数据集上进行实验。结果表明,所提出的路径意图点有效地提高了运动规划能力,并且Int2Planner在这些数据集上实现了最先进的规划性能;

4)本文在现实世界车辆上部署了Int2Planner,测试结果表明,Int2Planner能够对复杂交通场景做出反应,并且生成安全且合理的规划轨迹。

ef70174274ba69ef77138a67722239a5.jpeg

论文图片和表格

ab66100c6ff0e94481c348f7060b6821.png

4b82b49a14c16dc7c9fa84d207a88150.png

240fd9a285a279914522b69e432efa39.png

4379a1898d5e33601eb92d01015115f4.png

18100d996503d935a9018fd27fc27689.png

cec670653f249e0830eec8da8a58dd41.png

901bb50cfc6ca819daa7ec2e7d83df52.png

a8f7c9cec84f2c638dae5d691c19c5d9.png

e6269c81b85f3e5fea9e108e53ca6b4a.png

af1017b338dc454b127a961e485af032.png

2ac459ef5252725471d956f9218625e8.png

f51ba4cc953df7732e7c25f5bc0fb959.png

85b580f281123249fe765efe9d05c848.jpeg

总结

ed2cc28edd5a0a5b40063ad02854d3d8.png

本文提出了Int2Planner,这是一种基于意图的运动规划器,用于实现集成预测和规划。本文通过路径意图点来约束自身智能体(EA)的不确定性,并且根据路径意图点来生成和优化多模态规划轨迹。实验结果表明,本文模型实现了最先进的性能。路径意图点有效地提高了规划性能,并且为EA提供了合理的意图。此外,在现实世界车辆上部署了Int2Planner,测试表明,Int2Planner能够与环境持续交互,并且输出合理且安全的规划轨迹。

局限性和未来工作:在闭环仿真和实车测试中,目前利用了具有最高置信度的输出规划轨迹,但是该轨迹不一定是最优的,特别是在复杂的交通场景中。在未来工作中,将着重于处理多模态规划,以进一步提升性能。

① 2025中国国际新能源技术展会

自动驾驶之心联合主办中国国际新能源汽车技术、零部件及服务展会。展会将于2025年2月21日至24日在北京新国展二期举行,展览面积达到2万平方米,预计吸引来自世界各地的400多家参展商和2万名专业观众。作为新能源汽车领域的专业展,它将全面展示新能源汽车行业的最新成果和发展趋势,同期围绕个各关键板块举办论坛,欢迎报名参加。

d2ca6e6c2a4c155b0f3e53d2a032d438.jpeg

② 国内首个自动驾驶学习社区

『自动驾驶之心知识星球』近4000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知端到端自动驾驶世界模型仿真闭环2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案大模型,更有行业动态和岗位发布!欢迎扫描加入

8701fa4d31bc740c60b3ab7e6ab02860.png

 ③全网独家视频课程

端到端自动驾驶、仿真测试、自动驾驶C++、BEV感知、BEV模型部署、BEV目标跟踪、毫米波雷达视觉融合多传感器标定多传感器融合多模态3D目标检测车道线检测轨迹预测在线高精地图世界模型点云3D目标检测目标跟踪Occupancy、CUDA与TensorRT模型部署大模型与自动驾驶NeRF语义分割自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频(扫码即可学习

1bdd60cb9a8f949c8e701fb9dbf7ed86.png

网页端官网:www.zdjszx.com

④【自动驾驶之心】全平台矩阵

4dd0e0d4fde45f50969bff3de6789f11.png

您可能感兴趣的与本文相关的镜像

Qwen3-VL-8B

Qwen3-VL-8B

图文对话
Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型,这一代在各个方面都进行了全面升级:更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力,以及更强的代理交互能力

内容概要:本文介绍了ENVI Deep Learning V1.0的操作教程,重点讲解了如何利用ENVI软件进行深度学习模型的训练与应用,以实现遥感图像中特定目标(如集装箱)的自动提取。教程涵盖了从数据准备、标签图像创建、模型初始化与训练,到执行分类及结果优化的完整流程,并介绍了精度评价与通过ENVI Modeler实现一键化建模的方法。系统基于TensorFlow框架,采用ENVINet5(U-Net变体)架构,支持通过点、线、面ROI或分类图生成标签数据,适用于多/高光谱影像的单一类别特征提取。; 适合人群:具备遥感图像处理基础,熟悉ENVI软件操作,从事地理信息、测绘、环境监测等相关领域的技术人员或研究人员,尤其是希望将深度学习技术应用于遥感目标识别的初学者与实践者。; 使用场景及目标:①在遥感影像中自动识别提取特定地物目标(如车辆、建筑、道路、集装箱等);②掌握ENVI环境下深度学习模型的训练流程与关键参数设置(如Patch Size、Epochs、Class Weight等);③通过模型调优与结果反馈提升分类精度,实现高效自动化信息提取。; 阅读建议:建议结合实际遥感项目边学边练,重点关注标签数据制作、模型参数配置与结果后处理环节,充分利用ENVI Modeler进行自动化建模与参数优化,同时注意软硬件环境(特别是NVIDIA GPU)的配置要求以保障训练效率。
内容概要:本文系统阐述了企业新闻发稿在生成式引擎优化(GEO)时代下的全渠道策略与效果评估体系,涵盖当前企业传播面临的预算、资源、内容与效果评估四大挑战,并深入分析2025年新闻发稿行业五大趋势,包括AI驱动的智能化转型、精准化传播、首发内容价值提升、内容资产化及数据可视化。文章重点解析央媒、地方官媒、综合门户自媒体四类媒体资源的特性、传播优势与发稿策略,提出基于内容适配性、时间节奏、话题设计的策略制定方法,并构建涵盖品牌价值、销售转化与GEO优化的多维评估框架。此外,结合“传声港”工具实操指南,提供AI智能投放、效果监测、自媒体管理与舆情应对的全流程解决方案,并针对科技、消费、B2B、区域品牌四大行业推出定制化发稿方案。; 适合人群:企业市场/公关负责人、品牌传播管理者、数字营销从业者及中小企业决策者,具备一定媒体传播经验并希望提升发稿效率与ROI的专业人士。; 使用场景及目标:①制定科学的新闻发稿策略,实现从“流量思维”向“价值思维”转型;②构建央媒定调、门户扩散、自媒体互动的立体化传播矩阵;③利用AI工具实现精准投放与GEO优化,提升品牌在AI搜索中的权威性与可见性;④通过数据驱动评估体系量化品牌影响力与销售转化效果。; 阅读建议:建议结合文中提供的实操清单、案例分析与工具指南进行系统学习,重点关注媒体适配性策略与GEO评估指标,在实际发稿中分阶段试点“AI+全渠道”组合策略,并定期复盘优化,以实现品牌传播的长期复利效应。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值