谈一谈端到端任务对自动驾驶的影响，以及量产遇到的困难！

最新推荐文章于 2025-12-03 15:13:50 发布

转载最新推荐文章于 2025-12-03 15:13:50 发布 · 446 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247583141&idx=1&sn=37e4acbdbd0b7b8ff6b000cb57a5dcc7&chksm=cf842c7b49935d2fcbe1b14f8c8abeea11c515d963a60e10e83a9ac27c71851e3b98b522aac8&scene=126&sessionid=0

文章标签：

#自动驾驶 #人工智能 #机器学习

本文探讨了特斯拉在端到端自动驾驶技术上的突破，如UniAD模型和FSD系统的简化，以及面临的训练稳定性、数据需求、算力挑战等问题。它指出端到端方法虽有潜力颠覆现状，但实施过程中仍需解决大量工程和数据难题。

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

>>点击进入→自动驾驶之心【端到端】技术交流群

2023 CVPR会议上，将best paper颁给了UniAD，由上海人工智能实验室李弘扬老师及其团队出品，端到端任务彻底掀开了帷幕。现在主流的量产方案通常是多个模块结果做融合处理，包括动态障碍物/静态障碍物检测、轨迹预测模块等，后处理及逻辑上需要花费大量的时间和精力，最终结合输出下游规控能用的结果。不得不说，这种方式不够优雅，功能上需要结合2D/3D任务，一个完整的自动驾驶产品级模块，至少需要5个模型及以上完成（当然也有多任务学习的one-model），每个模型需要反复优化处理各类corner case，耗时耗力。那么有没有去除类间任务不一致，做成统一模型的方案呢？能够直接输出车辆控制指令（如转向、加速、制动等）？答案是肯定的，当现有方案出现了问题或者瓶颈，往往会往人类认为最简约和直接的方向上靠。

特斯拉是这个方向的先驱者，钢铁侠是一个极致追求简约和问题本质的人，从开始坚持纯视觉方案（去激光雷达）到提出BEV架构、Occupancy任务，一直在突破新的技术难点。今年特斯拉利用端到端大模型再次掀起革命，FSD系统从30万行，缩减到了3000行，端到端大模型被特斯拉率先工程化实现了，特斯拉又一次确立了自动驾驶技术领域的领军者地位。

那么端到端任务好做吗？首先说下模型训练部分，端到端的任务从视觉输入，到下游任务输出，中间gap过于大，导致训练很不稳定，UniAD采用了多任务多阶段微调，最终输出结果。而且中间的不可解释性会给产品的研发和迭代造成巨大的负面影响，所以很多自动驾驶公司不敢投入较大人力尝试。