导语
1989年,卡内基·梅隆大学的 Dean Pomerleau 把三层神经网络塞进一辆军用悍马,并取名 ALVINN(Autonomous Land Vehicle In A Neural Network)。它虽然只在卡耐基·梅陇大学校园实现了自主行驶, 却点燃了全球工程师对“让机器自己驾驶”的集体想象。
36 年过去,自动驾驶技术正在重塑我们的出行方式,我们已能把更高的算力塞进方向盘下方,把端到端大模型装进车规芯片,让“车位到车位”的无人通行在 200 座城市同时发生。不得不承认,这场始于十多年前实验室探索的变革,如今已逐渐走向大众市场。
各大科技公司、车企和初创公司在全球范围内展开了一场技术竞赛,推动着智能驾驶技术的快速发展。从最开始基于规则的 “if-else” 到现在 VLA、 World Model,从封闭的测试场景到现在马路上随处可见的“智驾小蓝灯”,每一次技术的跃迁都离不开每个企业,每个工程师的努力。
这篇文章,自动驾驶之心团队将带你回顾国内外主流智驾公司的技术发展历程,梳理关键节点以及技术路线。
PS.本文是自动驾驶编年史系列的第一篇,后续还将持续回顾业内其他优秀公司的技术发展历程!关于更多自动驾驶的行业信息、技术进展、岗位内推和交流问答,欢迎加入『自动驾驶之心知识星球』,我们准备了国庆节&中秋节大额优惠...

1
特斯拉


先说特斯拉。纵观前几年的自动驾驶发展,说特斯拉是先驱一点也不为过,每次的 AI day 都给大家带来新技术和新视角。至少短时间里,国内很多厂商都是摸着特斯拉的路线在过河。
总的来说,特斯拉的自动驾驶技术发展路线,是一条彻底颠覆传统、以数据驱动为核心的激进之路。它坚决摒弃了激光雷达和高精地图,选择纯视觉感知方案,并通过其庞大的车队规模构建起难以逾越的数据壁垒。从早期基于规则的模块化设计,到BEV+Occupancy的空间感知,最终迈向端到端神经网络,特斯拉始终致力于让AI更像人类一样“思考”和驾驶。这条路不仅重新定义了自动驾驶的技术范式,更迫使整个行业在算法演进、算力竞争和数据积累上加速内卷,深刻影响了智能汽车的发展方向。


1
BEV (Bird's Eye View)

时间:2021年AI Day
核心:通过Transformer模型将车辆多个摄像头输入的2D图像特征,转换到统一的3D向量空间(鸟瞰图视角),实现多摄像头感知融合。
优点:
大幅降低对高精地图的依赖,提升系统泛化能力。
提供更精准的环境感知和车辆定位。
为后续更复杂的感知任务奠定了基础。
挑战:
仅能感知类别已知的目标(如车、人),对训练集外的未知异形障碍物(如掉落货物)识别能力有限。
感知结果(如3D框)无法描述物体的具体形状轮廓。

2
Occupancy Network (占用网络)

时间:2022年AI Day
核心:将车辆周围3D空间划分为微小体素(voxel),不再识别物体类别,只预测每个体素是否被占用,从而实现对任意障碍物的感知。
优点:
能有效识别任何形状的障碍物(包括异形车、路障、石头等),解决了长尾障碍物问题。
能更好地处理遮挡问题,对动态和静态物体均能有效检测。
能生成更精确的可行驶空间,供规划模块使用。
缺点:
计算量和内存消耗巨大,对芯片算力要求高。
真值标注获取难度大,模型训练复杂。
输出的是网格而非具体物体,需与其他模块配合进行行为预测。

3
End-to-End(端到端)

时间:2022年底启动研发,2024年3月FSD V12大规模推送
核心:用一个统一的深度学习模型,直接输入传感器数据(图像),输出控制指令(转向、刹车、油门),替代传统分模块处理的Pipeline。
优点:
信息无损传递,减少人为规则带来的偏见。
驾驶行为更丝滑拟人化,通行效率和舒适性提升。
极大简化数据闭环流程,更易于模型迭代升级。
能更好地处理复杂交互博弈场景。
缺点:
“黑盒”模型可解释性差,出现问题难以调试。
对训练数据质量和数量要求极高。
安全验证和仿真测试更困难。

2
华为(车 BU)


华为ADS技术路线的演进,清晰地展现了其从初期的多传感器融合和高精地图依赖,到中期的“无图”化突破和感知算法增强,再到现阶段端到端大模型应用和全域驾驶能力贯通,并最终迈向云端赋能和L3世界模型高阶自动驾驶的历程。


1
ADS 1.0:多传感器融合的起点

发布时间:2021年4月
核心特点:
技术路线:采用多传感器融合方案(包括3颗激光雷达、6个毫米波雷达、13个摄像头),依赖高精地图进行路径规划与障碍物检测。
功能聚焦:主要实现了高速领航NCA和基础的自动泊车功能。
局限性:对高精地图的依赖限制了其城市拓展性,复杂的硬件配置也导致成本较高。
首发车型:极狐阿尔法S HI版

2
ADS 2.0:“无图”智驾的关键突破

发布时间:2023年4月
核心突破:
技术路线:实现 “无图”智驾,摆脱了对高精地图的依赖,基于道路拓扑推理网络实时生成环境感知。引入了 GOD(Generalized Obstacle Detection,通用障碍物检测)网络,通过激光雷达、毫米波雷达、摄像头等多传感融合的感知,异形障碍物也能识别。
硬件优化:激光雷达数量从3颗精简至1颗,毫米波雷达和摄像头数量也有所减少,在降低成本的同时提升了感知能力。
性能提升:平均人工接管里程从ADS 1.0的100公里提升至200公里。
城市扩张:城区NCA(智驾领航辅助)在2023年落地深圳、上海、广州等城市。
首发车型:AITO问界M5智驾版

3
ADS 3.0:端到端架构与全域贯通

发布时间:2024年4月(命名为乾崑智驾)
核心升级:
技术路线:采用端到端大模型架构,融合了GOD感知网络、PDP(预测-决策-规划)网络和本能安全网络。支持 “车位到车位” 的全场景智能驾驶。
硬件升级:搭载华为自研192线激光雷达(探测精度3cm),并国内首发高精度4D毫米波雷达。计算平台采用MDC610/810,提供200-400+ TOPS算力。
关键能力:智能驾驶系统的超远距探测能力提升35%,时延降低65%,城区混行及泊车成像精度提升4倍。
车型搭载:于2024年9月起陆续推送,率先搭载于阿维塔车型,后续也应用于问界M9、享界S9等车型。

4
ADS 4.0:迈向L3与云端赋能

发布时间:2025年4月(发布,未完全落地)
核心特点(从发布会来看):
技术路线:采用WEWA架构(世界引擎+世界行为模型),由云端的世界引擎和车端的世界行为模型组成。
关键支持:将分为多个版本,其中ADS Ultra旗舰版将正式支持高速L3级自动驾驶。
云端赋能:依托45EFLOPS的云端AI算力和10亿公里高质量训练数据进行算法迭代优化。
计划升级:享界S9计划于2025年9月30日起升级,鸿蒙智行其他车型也将陆续推送。

3
Momenta


Momenta 自创立以来,便前瞻性地锚定了“一个飞轮两条腿”的核心技术路径。所谓“一个飞轮”是指数据驱动算法、海量数据、闭环自动化工具链,靠着这条工具链使得数据和算法之间形成快速迭代的反馈闭环,让“飞轮”越转越快。而“两条腿”是指:左腿 - 量产自动驾驶(Mpilot),为行业交付可量产的自动驾驶系列产品,并提供源源不断的数据流。右腿 - 完全无人驾驶(MSD),致力于打造L4级别的完全无人驾驶,并反馈给量产产品领先的技术流
总的来说,该战略是在通过大规模量产辅助驾驶系统收集海量的真实道路数据,以此驱动更高级别自动驾驶技术的持续进化,再将高阶技术成果反哺迭代量产系统,从而形成一个强大的数据驱动闭环。


1
Mpilot Parking

时间:2019年
核心技术:低成本自动化建图(视觉为主,精度10cm);众包更新地图(量产车行驶即可建图更新)
优势:成本低;不依赖场端改造(买来即用);支持复杂地库场景(上下坡、行人、车辆占道等)
劣势:作为早期产品,功能主要集中在泊车场景,适用范围相对单一。

2
AD 2.0:规则至上

时间:2022年
核心技术:规划基于规则;感知为多任务且各任务数据驱动;包括检测、高精地图、融合 & 跟踪等模块。
优势:实现了初期的量产落地,功能相对稳定。
劣势:拓展性差,难以快速适应新场景和新区域;依赖高精地图;面对复杂场景或长尾问题,规则系统的能力上限较低。

3
AD 3.0:向数据驱动的转型

时间:2023年上半年
核心技术:感知将时序任务整合到同一模型;规划逐渐从规则转型数据驱动;有FTP融合 & 跟踪 & 预测等模块。
优势:开启了数据驱动的转型,提升了系统应对复杂场景的潜力和泛化能力。
劣势:仍是模块化设计,感知与规划间的信息损失和误差累积问题仍然存在。

4
AD 4.0:数据驱动的两段式端到端

时间:2023年下半年
核心技术:感知所有任务整合到同一模型;规划全部数据驱动处理;涵盖4D感知DDOD检测 & 融合 & 跟踪 & 预测等。
优势:全面采用数据驱动算法,性能得到大幅提升。
劣势:仍是感知与规划分离的两段式 pipeline,对于未明确定义的障碍物(如异形障碍物)处理能力有限。

5
AD 5.0:一段式端到端智驾大模型

时间:2024年
核心技术:一段式端到端智驾大模型:感知与规划整合进一个大模型,模仿人类长期记忆,保留DLP模型类似短期记忆;采用直觉+逻辑的双系统协作。
优势:大幅降低延迟,高效解决长尾问题,驾驶体验更类人。
劣势:系统复杂性高,开发和调试难度大;可靠性验证需要大量实际路测和仿真数据。

6
R6飞轮大模型

时间:2025年
核心技术:基于强化学习 ;自我进化(模拟环境中探索新行为,从成功失败中学习);超大规模训练数据(基于30亿公里提炼的7000万黄金数据)
优势:驾驶能力有望超越人类(安全、安心);持续快速自我成长 ;带来极智的驾乘体验(安全、丝滑拟人、高效)
劣势:技术非常前沿,大规模量产应用的可靠性和稳定性有待长期验证;成本控制是实现大规模搭载的关键。

4
地平线


作为中国领先的智能驾驶计算方案提供商,地平线走出了一条从车规级AI芯片突破,到提供全栈解决方案,再到开放生态赋能的独特路径,其技术演进与其芯片研发紧密相连。所以当我们谈论地平线的智驾方案的时候,也不得不提其在车规芯片的发展。



如果我们回顾地平线的技术发展,可以看出其清晰的演进逻辑:
软硬结合,效率至上:从创立之初就坚定走软件算法与芯片硬件协同优化的道路,以提升效率、降低功耗和成本。
渐进路线,数据驱动:从L2/L2+辅助驾驶切入,逐步向高阶自动驾驶迈进,通过大规模量产车积累数据和反哺算法。
生态赋能,开放共赢:通过开放的平台化战略,降低主机厂智能驾驶开发门槛,推动技术普及和规模化应用。

1
早期ADAS原型

时间:2016年
芯片:暂无
核心功能: 实现车道线、车辆、行人检测跟踪

2
Horizon Matrix® Mono

时间:2021年
芯片:征程2、征程3
核心功能: L2级辅助驾驶,支持多类目标实时检测识别,800万像素前视摄像头

3
Horizon Matrix® Pilot

时间:2022年
芯片:征程5
核心功能: L2+级高速NOA,支持360度感知覆盖、自动变道超车、自动上下匝道

4
城市NOA方案

时间:2023年
芯片:征程5
核心功能:基于单征程5芯片,支持城区领航辅助驾驶,应对复杂路况、交通信号灯识别、混行道路

5
Horizon SuperDrive

时间:2025年
芯片:征程6系列
核心功能:覆盖L2城区辅助驾驶,软硬结合全栈开发,支持10-20万元主流市场 旨在实现高阶智驾方案的规模化落地
站在2025的现在,地平线正将其智能驾驶芯片和技术能力拓展至更广阔的领域:
机器人领域:成立了全资子公司地瓜机器人,聚焦机器人核心计算平台。机器人与智能驾驶在芯片架构、感知算法、算力需求上高度协同。
持续高阶进化:征程6系列芯片(如征程6P算力达560TOPS)是面向全场景智能驾驶应用的性能旗舰版方案,能够全面发挥片上系统的计算性能,是支持当下先进端到端智驾路线的选择。

5
卓驭科技(原大疆车载)


卓驭科技,作为2023年从大疆独立出来的公司,在智能驾驶领域走出了一条兼顾高性能与低成本的技术路线。他们凭借独特的立体视觉技术和灵活的硬件方案,成功将高阶智能驾驶功能推广至更亲民的车型。


1
成行平台基础版

时间:2023年
配置:7V + 32TOPS
核心功能与特点:实现高速NOA、记忆泊车等功能。硬件成本约5000元人民币。

2
成行平台升级版

时间:2024年
配置:7V + 100TOPS
核心功能与特点:依赖7颗摄像头和100TOPS算力芯片实现无图、纯视觉城区智驾功能,硬件成本约7000元人民币。 旨在让15万元级别乘用车拥有城市领航。

3
成行平台高配版

时间:2024年
配置:10V + 100TOPS
核心功能与特点:前视惯导双目升级为前视惯导三目(新增800万像素长焦单目),车身两侧各增加一颗侧视单目摄像头,提升前向及侧向感知距离,应对更复杂场景。

4
可解释端到端算法

时间:2024年11月
核心功能与特点:从感知端的多源信息融合输入直出驾驶轨迹,新增无图城市领航功能,支持路口左右转、避障绕行等全场景功能,泊车场景也得到全面优化。

5
激目系统

时间:2025年
配置:惯导三目集成激光雷达 ("前前融合")
核心功能与特点:舱内安装的车规级集成式传感器,通过"前前融合"技术提升复杂场景下的安全感和舒适性,为L3/L4做准备,综合成本较传统分离式方案降低30%-40%,旨在下放至30万以内车型。

6
理想


理想汽车的技术发展路线经历了从依赖规则算法(2021年,类似“昆虫智能”)到端到端+VLM模仿学习(2024年,类似“哺乳动物智能”),最终进化至VLA司机大模型(2025年,开启“人类智能”)的清晰三段式演进。其核心在于通过在“视觉”与“行动”间加入“语言”思考维度,并借助强化学习与世界模型仿真,使自动驾驶系统从被动反应变为能主动理解、推理并决策的“专职司机”。这不仅推动了其辅助驾驶体验的质变(如接管里程大幅提升及使用率翻倍),更通过将AI转化为可靠“生产工具”,为行业在高阶智驾的落地路径上提供了关键范本。


1
规则驱动 (Rule-Based)

时间:~2021年及以前
核心:工程师基于先验知识编写大量“if-else”规则,将驾驶任务分解为感知、定位、规划、控制等独立模块。
优点:
可解释性强:每个模块的输出都可单独监控和调试,易于追溯问题。
安全验证明确:各模块可独立进行安全认证。
缺点:
难以穷尽所有场景(长尾问题),泛化能力极差。
维护成本高:规则数量庞杂,新增规则可能引发冲突。
依赖高精地图:一旦地图失效,系统性能大幅下降。

2
端到端

时间:2023年起成为行业共识并加速发展
核心:用一个统一的深度学习模型,直接从传感器(摄像头)输入映射到控制指令(转向、油门、刹车)输出。主要通过模仿学习(Imitation Learning) 来训练模型。
优点:
信息无损传递:避免模块间信息损失和误差累积。
性能上限高:驾驶行为更丝滑拟人,能发现人类未预设的模式。
开发流程简化:无需设计复杂模块接口。
缺点:
“黑盒”模型可解释性差:决策过程不透明,出现问题难以调试。
安全验证困难:难以进行形式化验证。
训练数据需求巨大:需要覆盖各种边缘情况。
缺乏因果推理:本质是“死记硬背”的模仿,缺乏真正理解。

3
VLM

时间:2024年(作为E2E的辅助系统)
核心:利用视觉与语言信息对交通标识、路况环境等进行额外解析,为端到端大模型提供明确的指导。它通常作为“慢思考”系统与端到端模型的“快直觉”系统协同工作。
优点:
增强环境语义理解:能更好地理解交通标志、信号灯等语义信息。
缺点:
推理延迟较高:无法满足实时控制的要求。
不直接输出控制信号:仅作为辅助决策系统。

4
VLA司机大模型

时间:2025年进入量产落地期
核心:VLA是端到端思维的延伸。它将视觉感知、语言推理(内部思维链CoT)和行动输出在同一个模型中进行统一建模。其训练通常结合了模仿学习(IL)和强化学习(RL)。
优点:
具备因果和逻辑推理能力:能理解场景背后的“为什么”,而不仅仅是“是什么”。
泛化能力极强:能高效处理未知的、训练数据中未出现过的长尾场景。
更接近人类智能:其智能程度首次接近人类驾驶员。
缺点:
算力与数据需求巨大:训练和部署成本极高。
研发门槛高:需要强大的AI工程能力和数据闭环体系。

7
小鹏


小鹏汽车的自动驾驶发展史是一个从无到有、从有到精、从特定场景到全场景的持续进化过程。其技术路线从早期的多传感器融合与高精地图依赖,逐步转向 “无图”化、端到端大模型驱动的方案。这个过程伴随着硬件算力的大幅提升和算法模型的不断革新。


1
XPILOT 2.0 / 2.5

时间:2018-2019年
核心:2018年4月发布G3全场景自动泊车技术(XPILOT 2.0),利用20个传感器实现自动泊车。2019年,XPILOT 2.5支持自动变道辅助,辅助驾驶能力从单车道向多车道迈进;并首次实现遥控泊车的量产。
优点:实现了最后一公里的智能驾驶。
缺点:早期功能相对基础,更多是解决特定场景(如泊车)的需求。

2
XPILOT 3.0

时间:2020年
核心:随小鹏P7发布,高速NGP(自动导航辅助驾驶)开启,实现了高速自动驾驶量产和全自研360度感知能力量产。
优点:高速场景下的辅助驾驶能力得到突破,提升了长途出行体验。
缺点:功能主要聚焦于高速场景,城市复杂路况仍需依赖驾驶员。

3
XPILOT 3.5

时间:2021年
核心:小鹏P5成为首款搭载激光雷达的量产车,具备了城市NGP的硬件基础。城市NGP率先在广州开放(后期仅在北京、上海、广州、深圳、佛山5城开放)。代客泊车功能实现量产。
优点:开启了城市道路高级别辅助驾驶的探索,拓展了智驾场景。
缺点:城市NGP开放城市数量非常有限,激光雷达和高精地图的成本较高。

4
XNGP(全场景辅助驾驶系统)
& AI大模型应用

时间:2022年
核心:智驾技术升级,进入AI大模型时代。不依赖高精地图的技术路线开始布局。年底小鹏G9使用两颗英伟达Orin芯片(算力508 TOPS)。
优点:提升了系统的泛化能力和迭代效率,降低了对高精地图的依赖。
缺点:技术转型初期,无图方案的稳定性和可靠性需要持续优化。

5
XNGP全域增强与全球布局

时间:2024年
核心:2024年1月,无图方案推动XNGP落地243城。计划年内实现国内全范围、点到点覆盖。端到端大模型全面上车。2024年将面向全球推进高速NGP的研发,2025年面向全球推进XNGP的研发。
优点:覆盖范围极广,迭代速度快(开城效率大大提升),用户体验提升。
缺点:极端天气或复杂场景下可靠性仍存挑战,无图状态下对感知和决策算法要求极高,全球不同地区的适配充满挑战。

6
All in VLA

时间:2025年
核心:将视觉感知 vision、语言推理 language 和行动 action 输出在同一个模型中进行统一建模。
优点:具备因果和逻辑推理能力;泛化能力更强。
缺点:训练和部署成本极高;研发门槛高

8
蔚来


蔚来的自动驾驶用一个词形容就是“保守”,其发展史是一个从合作研发到全栈自研,从相对保守到积极拥抱大模型,并始终强调安全基座的过程。他们可能不是每个功能都跑得最快,但非常注重技术的扎实和可靠。2025年世界模型NWM的上车,标志着蔚来智驾进入了新的发展阶段。


1
早期合作与自研起步

时间:2016年起
核心:蔚来在智能驾驶的早期研发阶段与Mobileye等供应商合作。
优点:利用成熟方案,起步相对稳健。
缺点:技术受限于供应商,功能迭代和差异化困难。

2
NOP与NOP+高速领航

时间:2020年及以后
核心:蔚来开启全栈自研,其高速NOP+功能不断迭代。至2024年4月,NOP+位列中国智能驾驶第一梯队,覆盖广泛的高速道路。
优点:高速场景下体验逐步完善,安全性提升(2024年称智驾安全性达人驾6.26倍)。
缺点:城区功能推送较晚(2024年4月底才推送城区功能),早期版本对复杂城市场景支持有限(如掉头、环岛)。

3
城区NOP+推送

时间:2024年4月
核心:蔚来宣布向全国NT2平台车型全量交付全域领航辅助NOP+的城区功能。采取订阅制,城区与高速领航合为一个订阅项目。得益于无图技术的推进和群体智能架构,通过用户车辆收集数据优化系统。
优点:覆盖范围广(官方称已完成726座城区的道路验证)。
缺点:初期在极端复杂路况下的通行效率和果断性可能不及人类驾驶员。

4
世界模型NWM上车

时间:2025年5月
核心:“蔚来世界模型NWM”首个版本正式推送。其技术架构向世界模型切换,具备理解物理规律、重建世界并进行多轨迹推演的能力(称能在0.1秒内推演216种可能)。
优点:认知和推理能力增强,主动安全功能行业领先,行泊体验全面进步。
缺点:技术非常前沿,其大规模应用后的长期稳定性和可靠性有待持续观察。
写在最后:自动驾驶之心团队在复盘这几家公司的技术发展历程时,不禁感慨人工智能正在改变整个世界,从生产力的升级到日常生活的改变。五年前,L2级别的智能驾驶渗透率还不足10%,而今年L2已经接近全面普及,渗透率预估65%-70%,我们也正站在L3落地的前夕。
所谓百年未有之大变局。这个世界正在发生巨大的改变,但同时我们也走在一条真正的道路上!
以上。共勉。

1528

被折叠的 条评论
为什么被折叠?



