什么样的技术才能成就一家顶流自动驾驶公司?

导语

1989年,卡内基·梅隆大学的 Dean Pomerleau 把三层神经网络塞进一辆军用悍马,并取名 ALVINN(Autonomous Land Vehicle In A Neural Network)。它虽然只在卡耐基·梅陇大学校园实现了自主行驶, 却点燃了全球工程师对“让机器自己驾驶”的集体想象。  

36 年过去,自动驾驶技术正在重塑我们的出行方式,我们已能把更高的算力塞进方向盘下方,把端到端大模型装进车规芯片,让“车位到车位”的无人通行在 200 座城市同时发生。不得不承认,这场始于十多年前实验室探索的变革,如今已逐渐走向大众市场。

各大科技公司、车企和初创公司在全球范围内展开了一场技术竞赛,推动着智能驾驶技术的快速发展。从最开始基于规则的 “if-else” 到现在 VLA、 World Model,从封闭的测试场景到现在马路上随处可见的“智驾小蓝灯”,每一次技术的跃迁都离不开每个企业,每个工程师的努力。

这篇文章,自动驾驶之心团队将带你回顾国内外主流智驾公司的技术发展历程,梳理关键节点以及技术路线。

PS.本文是自动驾驶编年史系列的第一篇,后续还将持续回顾业内其他优秀公司的技术发展历程!关于更多自动驾驶的行业信息、技术进展、岗位内推和交流问答,欢迎加入『自动驾驶之心知识星球』,我们准备了国庆节&中秋节大额优惠...

1

特斯拉

先说特斯拉。纵观前几年的自动驾驶发展,说特斯拉是先驱一点也不为过,每次的 AI day 都给大家带来新技术和新视角。至少短时间里,国内很多厂商都是摸着特斯拉的路线在过河。

总的来说,特斯拉的自动驾驶技术发展路线,是一条彻底颠覆传统、以数据驱动为核心的激进之路。它坚决摒弃了激光雷达和高精地图,选择纯视觉感知方案,并通过其庞大的车队规模构建起难以逾越的数据壁垒。从早期基于规则的模块化设计,到BEV+Occupancy的空间感知,最终迈向端到端神经网络,特斯拉始终致力于让AI更像人类一样“思考”和驾驶。这条路不仅重新定义了自动驾驶的技术范式,更迫使整个行业在算法演进、算力竞争和数据积累上加速内卷,深刻影响了智能汽车的发展方向。

1

BEV (Bird's Eye View)

时间:2021年AI Day

核心:通过Transformer模型将车辆多个摄像头输入的2D图像特征,转换到统一的3D向量空间(鸟瞰图视角),实现多摄像头感知融合。

优点:

  • 大幅降低对高精地图的依赖,提升系统泛化能力。

  • 提供更精准的环境感知和车辆定位。

  • 为后续更复杂的感知任务奠定了基础。

挑战:

  • 仅能感知类别已知的目标(如车、人),对训练集外的未知异形障碍物(如掉落货物)识别能力有限。

  • 感知结果(如3D框)无法描述物体的具体形状轮廓。

2

Occupancy Network (占用网络)

时间:2022年AI Day

核心:将车辆周围3D空间划分为微小体素(voxel),不再识别物体类别,只预测每个体素是否被占用,从而实现对任意障碍物的感知。

优点:

  • 能有效识别任何形状的障碍物(包括异形车、路障、石头等),解决了长尾障碍物问题。

  • 能更好地处理遮挡问题,对动态和静态物体均能有效检测。

  • 能生成更精确的可行驶空间,供规划模块使用。

缺点:

  • 计算量和内存消耗巨大,对芯片算力要求高。

  • 真值标注获取难度大,模型训练复杂。

  • 输出的是网格而非具体物体,需与其他模块配合进行行为预测。

3

End-to-End(端到端)

时间:2022年底启动研发,2024年3月FSD V12大规模推送

核心:用一个统一的深度学习模型,直接输入传感器数据(图像),输出控制指令(转向、刹车、油门),替代传统分模块处理的Pipeline。

优点:

  • 信息无损传递,减少人为规则带来的偏见。

  • 驾驶行为更丝滑拟人化,通行效率和舒适性提升。

  • 极大简化数据闭环流程,更易于模型迭代升级。

  • 能更好地处理复杂交互博弈场景。

缺点:

  • “黑盒”模型可解释性差,出现问题难以调试。

  • 对训练数据质量和数量要求极高。

  • 安全验证和仿真测试更困难。

2

华为(车 BU)

华为ADS技术路线的演进,清晰地展现了其从初期的多传感器融合和高精地图依赖,到中期的“无图”化突破和感知算法增强,再到现阶段端到端大模型应用和全域驾驶能力贯通,并最终迈向云端赋能和L3世界模型高阶自动驾驶的历程。

1

ADS 1.0:多传感器融合的起点

发布时间:2021年4月

核心特点:

  • 技术路线:采用多传感器融合方案(包括3颗激光雷达、6个毫米波雷达、13个摄像头),依赖高精地图进行路径规划与障碍物检测。

  • 功能聚焦:主要实现了高速领航NCA和基础的自动泊车功能。

  • 局限性:对高精地图的依赖限制了其城市拓展性,复杂的硬件配置也导致成本较高。

首发车型:极狐阿尔法S HI版

2

ADS 2.0:“无图”智驾的关键突破

发布时间:2023年4月

核心突破:

  • 技术路线:实现 “无图”智驾,摆脱了对高精地图的依赖,基于道路拓扑推理网络实时生成环境感知。引入了 GOD(Generalized Obstacle Detection,通用障碍物检测)网络,通过激光雷达、毫米波雷达、摄像头等多传感融合的感知,异形障碍物也能识别。

  • 硬件优化:激光雷达数量从3颗精简至1颗,毫米波雷达和摄像头数量也有所减少,在降低成本的同时提升了感知能力。

  • 性能提升:平均人工接管里程从ADS 1.0的100公里提升至200公里。

  • 城市扩张:城区NCA(智驾领航辅助)在2023年落地深圳、上海、广州等城市。

首发车型:AITO问界M5智驾版

3

ADS 3.0:端到端架构与全域贯通

发布时间:2024年4月(命名为乾崑智驾)

核心升级:

  • 技术路线:采用端到端大模型架构,融合了GOD感知网络、PDP(预测-决策-规划)网络和本能安全网络。支持 “车位到车位” 的全场景智能驾驶。

  • 硬件升级:搭载华为自研192线激光雷达(探测精度3cm),并国内首发高精度4D毫米波雷达。计算平台采用MDC610/810,提供200-400+ TOPS算力。

  • 关键能力:智能驾驶系统的超远距探测能力提升35%,时延降低65%,城区混行及泊车成像精度提升4倍。

车型搭载:于2024年9月起陆续推送,率先搭载于阿维塔车型,后续也应用于问界M9、享界S9等车型。

4

ADS 4.0:迈向L3与云端赋能

发布时间:2025年4月(发布,未完全落地)

核心特点(从发布会来看):

  • 技术路线:采用WEWA架构(世界引擎+世界行为模型),由云端的世界引擎和车端的世界行为模型组成。

  • 关键支持:将分为多个版本,其中ADS Ultra旗舰版将正式支持高速L3级自动驾驶。

  • 云端赋能:依托45EFLOPS的云端AI算力和10亿公里高质量训练数据进行算法迭代优化。

计划升级:享界S9计划于2025年9月30日起升级,鸿蒙智行其他车型也将陆续推送。

3

Momenta

Momenta 自创立以来,便前瞻性地锚定了“一个飞轮两条腿”的核心技术路径。所谓“一个飞轮”是指数据驱动算法、海量数据、闭环自动化工具链,靠着这条工具链使得数据和算法之间形成快速迭代的反馈闭环,让“飞轮”越转越快。而“两条腿”是指:左腿 - 量产自动驾驶(Mpilot),为行业交付可量产的自动驾驶系列产品,并提供源源不断的数据流。右腿 - 完全无人驾驶(MSD),致力于打造L4级别的完全无人驾驶,并反馈给量产产品领先的技术流

总的来说,该战略是在通过大规模量产辅助驾驶系统收集海量的真实道路数据,以此驱动更高级别自动驾驶技术的持续进化,再将高阶技术成果反哺迭代量产系统,从而形成一个强大的数据驱动闭环。

1

Mpilot Parking

时间:2019年

核心技术:低成本自动化建图(视觉为主,精度10cm);众包更新地图(量产车行驶即可建图更新)

优势:成本低;不依赖场端改造(买来即用);支持复杂地库场景(上下坡、行人、车辆占道等)

劣势:作为早期产品,功能主要集中在泊车场景,适用范围相对单一。

2

AD 2.0:规则至上

时间:2022年

核心技术:规划基于规则;感知为多任务且各任务数据驱动;包括检测、高精地图、融合 & 跟踪等模块。

优势:实现了初期的量产落地,功能相对稳定。

劣势:拓展性差,难以快速适应新场景和新区域;依赖高精地图;面对复杂场景或长尾问题,规则系统的能力上限较低。

3

AD 3.0:向数据驱动的转型

时间:2023年上半年

核心技术:感知将时序任务整合到同一模型;规划逐渐从规则转型数据驱动;有FTP融合 & 跟踪 & 预测等模块。

优势:开启了数据驱动的转型,提升了系统应对复杂场景的潜力和泛化能力。

劣势:仍是模块化设计,感知与规划间的信息损失和误差累积问题仍然存在。

4

AD 4.0:数据驱动的两段式端到端

时间:2023年下半年

核心技术:感知所有任务整合到同一模型;规划全部数据驱动处理;涵盖4D感知DDOD检测 & 融合 & 跟踪 & 预测等。

优势:全面采用数据驱动算法,性能得到大幅提升。

劣势:仍是感知与规划分离的两段式 pipeline,对于未明确定义的障碍物(如异形障碍物)处理能力有限。

5

AD 5.0:一段式端到端智驾大模型

时间:2024年

核心技术:一段式端到端智驾大模型:感知与规划整合进一个大模型,模仿人类长期记忆,保留DLP模型类似短期记忆;采用直觉+逻辑的双系统协作。

优势:大幅降低延迟,高效解决长尾问题,驾驶体验更类人。

劣势:系统复杂性高,开发和调试难度大;可靠性验证需要大量实际路测和仿真数据。

6

R6飞轮大模型

时间:2025年

核心技术:基于强化学习 ;自我进化(模拟环境中探索新行为,从成功失败中学习);超大规模训练数据(基于30亿公里提炼的7000万黄金数据)

优势:驾驶能力有望超越人类(安全、安心);持续快速自我成长 ;带来极智的驾乘体验(安全、丝滑拟人、高效)

劣势:技术非常前沿,大规模量产应用的可靠性和稳定性有待长期验证;成本控制是实现大规模搭载的关键。

4

地平线

作为中国领先的智能驾驶计算方案提供商,地平线走出了一条从车规级AI芯片突破,到提供全栈解决方案,再到开放生态赋能的独特路径,其技术演进与其芯片研发紧密相连。所以当我们谈论地平线的智驾方案的时候,也不得不提其在车规芯片的发展。

如果我们回顾地平线的技术发展,可以看出其清晰的演进逻辑:

  • 软硬结合,效率至上:从创立之初就坚定走软件算法与芯片硬件协同优化的道路,以提升效率、降低功耗和成本。

  • 渐进路线,数据驱动:从L2/L2+辅助驾驶切入,逐步向高阶自动驾驶迈进,通过大规模量产车积累数据和反哺算法。

  • 生态赋能,开放共赢:通过开放的平台化战略,降低主机厂智能驾驶开发门槛,推动技术普及和规模化应用。

1

早期ADAS原型

时间:2016年

芯片:暂无

核心功能: 实现车道线、车辆、行人检测跟踪

2

Horizon Matrix® Mono

时间:2021年

芯片:征程2、征程3

核心功能: L2级辅助驾驶,支持多类目标实时检测识别,800万像素前视摄像头

3

Horizon Matrix® Pilot

时间:2022年

芯片:征程5

核心功能: L2+级高速NOA,支持360度感知覆盖、自动变道超车、自动上下匝道

4

城市NOA方案

时间:2023年

芯片:征程5

核心功能:基于单征程5芯片,支持城区领航辅助驾驶,应对复杂路况、交通信号灯识别、混行道路

5

Horizon SuperDrive

时间:2025年

芯片:征程6系列

核心功能:覆盖L2城区辅助驾驶,软硬结合全栈开发,支持10-20万元主流市场 旨在实现高阶智驾方案的规模化落地

站在2025的现在,地平线正将其智能驾驶芯片和技术能力拓展至更广阔的领域:

  • 机器人领域:成立了全资子公司地瓜机器人,聚焦机器人核心计算平台。机器人与智能驾驶在芯片架构、感知算法、算力需求上高度协同。

  • 持续高阶进化:征程6系列芯片(如征程6P算力达560TOPS)是面向全场景智能驾驶应用的性能旗舰版方案,能够全面发挥片上系统的计算性能,是支持当下先进端到端智驾路线的选择。

5

卓驭科技(原大疆车载)

卓驭科技,作为2023年从大疆独立出来的公司,在智能驾驶领域走出了一条兼顾高性能低成本的技术路线。他们凭借独特的立体视觉技术和灵活的硬件方案,成功将高阶智能驾驶功能推广至更亲民的车型。

1

成行平台基础版

时间:2023年

配置:7V + 32TOPS

核心功能与特点:实现高速NOA、记忆泊车等功能。硬件成本约5000元人民币。

2

成行平台升级版

时间:2024年

配置:7V + 100TOPS

核心功能与特点:依赖7颗摄像头和100TOPS算力芯片实现无图、纯视觉城区智驾功能,硬件成本约7000元人民币。 旨在让15万元级别乘用车拥有城市领航。

3

成行平台高配版

时间:2024年

配置:10V + 100TOPS

核心功能与特点:前视惯导双目升级为前视惯导三目(新增800万像素长焦单目),车身两侧各增加一颗侧视单目摄像头,提升前向及侧向感知距离,应对更复杂场景。

4

可解释端到端算法

时间:2024年11月

核心功能与特点:从感知端的多源信息融合输入直出驾驶轨迹,新增无图城市领航功能,支持路口左右转、避障绕行等全场景功能,泊车场景也得到全面优化。

5

激目系统

时间:2025年

配置:惯导三目集成激光雷达 ("前前融合")

核心功能与特点:舱内安装的车规级集成式传感器,通过"前前融合"技术提升复杂场景下的安全感和舒适性,为L3/L4做准备,综合成本较传统分离式方案降低30%-40%,旨在下放至30万以内车型。

6

理想

理想汽车的技术发展路线经历了从依赖规则算法(2021年,类似“昆虫智能”)到端到端+VLM模仿学习(2024年,类似“哺乳动物智能”),最终进化至VLA司机大模型(2025年,开启“人类智能”)的清晰三段式演进。其核心在于通过在“视觉”与“行动”间加入“语言”思考维度,并借助强化学习与世界模型仿真,使自动驾驶系统从被动反应变为能主动理解、推理并决策的“专职司机”。这不仅推动了其辅助驾驶体验的质变(如接管里程大幅提升及使用率翻倍),更通过将AI转化为可靠“生产工具”,为行业在高阶智驾的落地路径上提供了关键范本。

1

规则驱动 (Rule-Based)

时间:~2021年及以前

核心:工程师基于先验知识编写大量“if-else”规则,将驾驶任务分解为感知、定位、规划、控制等独立模块。

优点:

  • 可解释性强:每个模块的输出都可单独监控和调试,易于追溯问题。

  • 安全验证明确:各模块可独立进行安全认证。

缺点:

  • 难以穷尽所有场景(长尾问题),泛化能力极差。

  • 维护成本高:规则数量庞杂,新增规则可能引发冲突。

  • 依赖高精地图:一旦地图失效,系统性能大幅下降。

2

端到端

时间:2023年起成为行业共识并加速发展

核心:用一个统一的深度学习模型,直接从传感器(摄像头)输入映射到控制指令(转向、油门、刹车)输出。主要通过模仿学习(Imitation Learning) 来训练模型。

优点:

  • 信息无损传递:避免模块间信息损失和误差累积。

  • 性能上限高:驾驶行为更丝滑拟人,能发现人类未预设的模式。

  • 开发流程简化:无需设计复杂模块接口。

缺点:

  • “黑盒”模型可解释性差:决策过程不透明,出现问题难以调试。

  • 安全验证困难:难以进行形式化验证。

  • 训练数据需求巨大:需要覆盖各种边缘情况。

  • 缺乏因果推理:本质是“死记硬背”的模仿,缺乏真正理解。

3

VLM

时间:2024年(作为E2E的辅助系统)

核心:利用视觉与语言信息对交通标识、路况环境等进行额外解析,为端到端大模型提供明确的指导。它通常作为“慢思考”系统与端到端模型的“快直觉”系统协同工作。

优点:

  • 增强环境语义理解:能更好地理解交通标志、信号灯等语义信息。

缺点:

  • 推理延迟较高:无法满足实时控制的要求。

  • 不直接输出控制信号:仅作为辅助决策系统。

4

VLA司机大模型

时间:2025年进入量产落地期

核心:VLA是端到端思维的延伸。它将视觉感知、语言推理(内部思维链CoT)和行动输出在同一个模型中进行统一建模。其训练通常结合了模仿学习(IL)和强化学习(RL)。

优点:

  • 具备因果和逻辑推理能力:能理解场景背后的“为什么”,而不仅仅是“是什么”。

  • 泛化能力极强:能高效处理未知的、训练数据中未出现过的长尾场景。

  • 更接近人类智能:其智能程度首次接近人类驾驶员。

缺点:

  • 算力与数据需求巨大:训练和部署成本极高。

  • 研发门槛高:需要强大的AI工程能力和数据闭环体系。

7

小鹏

小鹏汽车的自动驾驶发展史是一个从无到有、从有到精、从特定场景到全场景的持续进化过程。其技术路线从早期的多传感器融合与高精地图依赖,逐步转向 “无图”化、端到端大模型驱动的方案。这个过程伴随着硬件算力的大幅提升和算法模型的不断革新。

1

XPILOT 2.0 / 2.5

时间:2018-2019年

核心:2018年4月发布G3全场景自动泊车技术(XPILOT 2.0),利用20个传感器实现自动泊车。2019年,XPILOT 2.5支持自动变道辅助,辅助驾驶能力从单车道向多车道迈进;并首次实现遥控泊车的量产。

优点:实现了最后一公里的智能驾驶。

缺点:早期功能相对基础,更多是解决特定场景(如泊车)的需求。

2

XPILOT 3.0

时间:2020年

核心:随小鹏P7发布,高速NGP(自动导航辅助驾驶)开启,实现了高速自动驾驶量产和全自研360度感知能力量产。

优点:高速场景下的辅助驾驶能力得到突破,提升了长途出行体验。

缺点:功能主要聚焦于高速场景,城市复杂路况仍需依赖驾驶员。

3

XPILOT 3.5

时间:2021年

核心:小鹏P5成为首款搭载激光雷达的量产车,具备了城市NGP的硬件基础。城市NGP率先在广州开放(后期仅在北京、上海、广州、深圳、佛山5城开放)。代客泊车功能实现量产。

优点:开启了城市道路高级别辅助驾驶的探索,拓展了智驾场景。

缺点:城市NGP开放城市数量非常有限,激光雷达和高精地图的成本较高。

4

XNGP(全场景辅助驾驶系统)

& AI大模型应用

时间:2022年

核心:智驾技术升级,进入AI大模型时代。不依赖高精地图的技术路线开始布局。年底小鹏G9使用两颗英伟达Orin芯片(算力508 TOPS)。

优点:提升了系统的泛化能力和迭代效率,降低了对高精地图的依赖。

缺点:技术转型初期,无图方案的稳定性和可靠性需要持续优化。

5

XNGP全域增强与全球布局

时间:2024年

核心:2024年1月,无图方案推动XNGP落地243城。计划年内实现国内全范围、点到点覆盖。端到端大模型全面上车。2024年将面向全球推进高速NGP的研发,2025年面向全球推进XNGP的研发。

优点:覆盖范围极广,迭代速度快(开城效率大大提升),用户体验提升。

缺点:极端天气或复杂场景下可靠性仍存挑战,无图状态下对感知和决策算法要求极高,全球不同地区的适配充满挑战。

6

All in VLA

时间:2025年

核心:将视觉感知 vision、语言推理 language 和行动 action 输出在同一个模型中进行统一建模。

优点:具备因果和逻辑推理能力;泛化能力更强。

缺点:训练和部署成本极高;研发门槛高

8

蔚来

蔚来的自动驾驶用一个词形容就是“保守”,其发展史是一个从合作研发到全栈自研,从相对保守到积极拥抱大模型,并始终强调安全基座的过程。他们可能不是每个功能都跑得最快,但非常注重技术的扎实和可靠。2025年世界模型NWM的上车,标志着蔚来智驾进入了新的发展阶段。

1

早期合作与自研起步

时间:2016年起

核心:蔚来在智能驾驶的早期研发阶段与Mobileye等供应商合作。

优点:利用成熟方案,起步相对稳健。

缺点:技术受限于供应商,功能迭代和差异化困难。

2

NOP与NOP+高速领航

时间:2020年及以后

核心:蔚来开启全栈自研,其高速NOP+功能不断迭代。至2024年4月,NOP+位列中国智能驾驶第一梯队,覆盖广泛的高速道路。

优点:高速场景下体验逐步完善,安全性提升(2024年称智驾安全性达人驾6.26倍)。

缺点:城区功能推送较晚(2024年4月底才推送城区功能),早期版本对复杂城市场景支持有限(如掉头、环岛)。

3

城区NOP+推送

时间:2024年4月

核心:蔚来宣布向全国NT2平台车型全量交付全域领航辅助NOP+的城区功能。采取订阅制,城区与高速领航合为一个订阅项目。得益于无图技术的推进和群体智能架构,通过用户车辆收集数据优化系统。

优点:覆盖范围广(官方称已完成726座城区的道路验证)。

缺点:初期在极端复杂路况下的通行效率和果断性可能不及人类驾驶员。

4

世界模型NWM上车

时间:2025年5月

核心:“蔚来世界模型NWM”首个版本正式推送。其技术架构向世界模型切换,具备理解物理规律、重建世界并进行多轨迹推演的能力(称能在0.1秒内推演216种可能)。

优点:认知和推理能力增强,主动安全功能行业领先,行泊体验全面进步。

缺点:技术非常前沿,其大规模应用后的长期稳定性和可靠性有待持续观察。

写在最后:自动驾驶之心团队在复盘这几家公司的技术发展历程时,不禁感慨人工智能正在改变整个世界,从生产力的升级到日常生活的改变。五年前,L2级别的智能驾驶渗透率还不足10%,而今年L2已经接近全面普及,渗透率预估65%-70%,我们也正站在L3落地的前夕。

所谓百年未有之大变局。这个世界正在发生巨大的改变,但同时我们也走在一条真正的道路上!

以上。共勉。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值