世界模型与自动驾驶:最新算法&实战项目(特斯拉、视频、OCC等)

点击下方卡片,关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近30个方向学习路线

世界模型,近一年自动驾驶学术界和工业界的热词。很多小伙伴咨询柱哥,有没有一门系统讲解世界模型和自动驾驶的精品课程,筹备了很久终于和大家见面!

我们联合工业界大佬共同开展,先前的《端到端与VLA自动驾驶小班课》备受大家好评,因此我们进一步推出这门世界模型小班课,课程聚焦于通用世界模型、视频生成、OCC生成等世界模型算法,涵盖特斯拉世界模型、李飞飞团队Marble等。欢迎大家加入学习~

早鸟优惠!开课即止~

讲师介绍

Jason:C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF-B论文若干。现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的预研和量产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。

课程大纲

这门课程讲如何展开

第一章:世界模型介绍

第一章主要针对自动驾驶世界模型概括性的内容讲解。这一章老师会先复盘世界模型和端到端自动驾驶的联系,接着讲解世界模型的发展历史以及当下的应用案例。然后介绍世界模型有哪些流派:纯仿真的世界模型、仿真+Planning、生成传感器输入、生成感知结果等等流派。每一种流派在当前业界的应用,能解决什么问题,处于自驾的哪个环节。学术界和工业界都在做什么,相关的数据集、评测都有啥。在这一章节为大家一一解答~

第二章:世界模型的背景知识

世界模型的技术栈涉及十分广泛,第二章主要讲解世界模型的基础知识。我们从世界模型的场景表征开始,进一步扩展到Transformer、BEV感知等,在这一章老师会非常细致的带大家学习世界模型涉及到的背景知识,也为后续章节的展开奠定基础。

  • 首先老师会带大家复习下Transformer的基本概念,扩展到视觉Transformer,接着讲解为多模态大模型奠定基础的CLIP和LLAVA;

  • 接着详细介绍BEV感知的基础知识,以及世界模型相关工作中最常见的占用网络Occupancy Network;

  • 之后是扩散模型的理论知识讲解,当前基于扩散模型输出多模轨迹也是学术界和工业界追捧的热点,很多公司都在尝试落地;

  • 然后是世界模型中长提的闭环仿真,NeRF和3DGS,老师重点带大家梳理下核心概念,方便同学们后续自己扩展;

  • 最后讲解其他生成式模型,像VAE、GAN以及Next Token Prediction都是比较常见的生成式方法;

总结来说,第二章的内容是当下世界模型求职面试频率最高的技术关键词!

第三章:通用世界模型探讨

第三章聚焦在大家最关心的通用世界模型和最近自驾的热门工作。李飞飞团队的Marble、DeepMind提出的Genie 3、Meta团队最新的JEPA以及导航世界模型,还有最近业界讨论很广泛的VLA+世界模型算法 - DriveVLA-W0 和 特斯拉ICCV上最新分享的世界模型模拟器。Jason老师会把这些模型的来龙去脉、核心技术以及设计理念都会给大家通透的讲解。

第四章:基于视频生成的世界模型

第四章聚焦在视频生成类的世界模型算法上,也是目前学术界和工业界研究最多的领域。我们从Wayve的经典工作GAIA-1 & GAIA-2开始讲解,扩展到CVR'25 上交的UniScene、商汤的OpenDWM、中科大ICCV'25的工作InstaDrive。兼顾经典工作和最新的前沿进展为大家呈现视频生成类世界模型的领域进展。实战我们选取了商汤开源的OpenDWM为大家细致展开。

第五章:基于OCC的世界模型

第五章则聚焦在另一大类算法上 - OCC生成类的世界模型,三大论文讲解 + 一个项目实战:

  • 清华经典工作OccWorld;

  • 复旦OccLLaMA;

  • 华科ICCV'25中稿的HERMES;

  • 西交最新的II-World。

这类方法不局限于OCC生成一个任务,可以较容易的扩展为自车轨迹规划,从而进一步实现端到端。

第六章:世界模型岗位专题

有了前面五个章节的算法基础,第六章我们聚焦在更高层面的经验输出,这一章都是实打实老师工作多年的经验积累。世界模型在工业界的应用到底如何?行业内的痛点是什么?我们期望世界模型解决什么问题?又如何准备相关岗位的面试,什么内容是公司真正关注的?在这一章都会有答案!

面向人群

  • 需要自备GPU,推荐算力在4090及以上;

  • 一定的自动驾驶领域基础,熟悉自动驾驶的基本模块;

  • 了解transformer大模型、扩散模型、BEV感知等技术的基本概念;

  • 一定的概率论和线性代数基础,熟悉常用的数学运算;

  • 具备一定的python和pytorch语言基础;

学后收获

这门课程是首个面向端到端自动驾驶进阶实战教程,我们期望能够推动端到端在工业界中的落地,助力更多想要加入到自动驾驶行业的同学真正理解端到端。

  • 我们期望学完本课程:学完能够达到1年左右世界模型自动驾驶算法工程师水平;

  • 掌握世界模型技术进展,涵盖视频生成、OCC生成等方法;

  • 对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻的了解;

  • 可复现II-World、OpenDWM等主流算法框架;

  • 能够将所学应用到项目中,真正搞懂如何设计自己的世界模型;

  • 无论是实习、校招、社招都能从中受益;

课程进度安排

课程开课时间:1.1号,预计两个半月结课。离线视频教学,vip群内答疑+三次线上答疑,答疑时间截止2026.12.31日。

开始解锁时间

对应章节

12.10

第一章

1.1

第二章

1.20

第三章

2.4

第四章

2.24

第五章

3.1

第六章

课程咨询

早鸟拼团!扫码试听
扫码报名!抢占课程名额
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值