没想到3DGS已经成为刚需？！

最新推荐文章于 2025-09-29 22:19:26 发布

转载最新推荐文章于 2025-09-29 22:19:26 发布 · 1.4k 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247646902&idx=2&sn=121ba13fa9678c55b5ef91f57a4c316e&chksm=cf190402bb1f7794ceaa516a2f15dfbfd4da1c7311549b7899c8b3c10b4362e84b85c951f9ec&scene=126&sessionid=0

文章标签：

#3d

神经辐射场（Neural Radiance Fields）自2020年被提出以来，相关论文数量呈指数增长，不但成为了三维重建的重要分支方向，也逐渐作为自动驾驶闭环仿真的重要工具。三年多的时间里，新的算法和改进层出不穷，其视觉质量逐步提高突破。并且在该技术的支持下，许多领域都取得了突破性的成果。但NeRF per-pixel ray marching的原理避免不了重建效率较低、过度平滑且容易发生灾难性遗忘。因此研究人员开始思考，有没有更好更快的三维场景表达形式，以实现高质量重建。

至此3DGS应运而生。原始的3DGS算法聚焦于静态场景重建，研究人员进一步引入时序位姿构造4DGS，而压缩3D表示到2D则为2DGS。三维重建领域旋即又是一轮新的变革风暴，目前已经应用到数字人体、表面重建、自动驾驶场景重建等等子领域，甚至在自动驾驶Occupancy感知、预训练等方面也也有很多优秀的工作。可以说，3DGS是当下自动驾驶领域乃至计算机视觉领域最火的方向之一，是科研和落地的最前线！

3DGS为什么受欢迎？

相比于隐式神经网络的黑盒表示，3D Gaussian的表征方式更符合直觉，更通俗易懂。3DGS之所以爆火，很大程度在于他的实时性。除此之外，Gaussian Splatting根本不涉及任何神经网络，甚至没有一个小型的 MLP，也没有什么 "神经"的东西，场景本质上只是空间中的一组点。而更重要的一点，相比自动驾驶感知任务、大模型之类的领域，3DGS所需的算力非常小，基本上单卡就能运行，训练往往只需要分钟级。在大家都在研究数十亿个参数组成的模型的人工智能世界里，这种方法越来越受欢迎，令人耳目一新。

目前为止，3D Gaussian Splatting已经衍生出很多子领域，原始3DGS关注静态场景的重建；引入时序位姿进化为4DGS，重建动态场景；压缩三维表示到2DGS，重建表面场景；动静态结合可以重建自动驾驶场景。

重建效果如何？

静态场景重建：

表面场景重建：

动态场景重建：

自动驾驶场景重建：

入门学习仍然困难？

正如前文所述，3DGS发展至今已经衍生出各个子方向，3D Gaussian如何表示三维世界？又是如何渲染出二维图像？时序又如何引入进化到4D GS？整个3DGS涉及到的模块、细节众多。这类知识点琐碎，系统也比较复杂，如果没有比较好的教程带着入门，往往会踩坑，后期不知道怎么学习。新视角泛化怎么提升？场景编辑又是什么魔法？自动驾驶仿真闭环又是如何用到Gaussian Splatting的？工业界和科研还适不适合入局？这些都是阻挡新手入门以及进阶的难点。

早鸟拼团立减300！扫码加入学习！

为此，我们联合业内头部自动驾驶公司算法专家，联合展开了业内首门面向3DGS全栈实战小班课，Cover 3DGS的各个子领域，让大家真正能够学得透彻，后期配有代码实战讲解，助力大家真正从实现的角度上搞懂算法。同时作为专享福利，小班课将赠送《NeRF与自动驾驶论文带读课程》!

小班课完整版大纲如下：

这门课程将会如何展开

第一章：视觉重建算法基础

第一章会介绍视觉重建领域的基础算法。视觉重建属于计算机视觉和计算机图形学的交叉领域，其基础算法也会涉及到这两个研究方向。神经辐射场（NeRF）和3D高斯泼溅（3DGS）的提出就是建立在视觉重建算法的基础上。本章的内容主要包括：

第二章：3DGS大观

第二章会详细介绍有关3DGS的技术细节。3DGS自从发表在Siggraph 2023上，由于其训练和渲染速度快的特点，在不到两年的时间内迅速发展，被大量的相关工作采用作为基础模块并且扩展到自动驾驶领域。因此第二章带大家深度入门3DGS，从数据到算法、从可视化到评测、从整体到细节模块，全面剖析！本章的内容主要包括：

第三章：静态场景重建-3DGS

第三章会挑选有关增强3DGS在静态场景中渲染表现的三个工作进行剖析。对于项目实战，本章挑选CVPR2024的最佳学生论文Mip-Splatting作为主体。Mip-Splatting专注于对3DGS在多分辨率图像下的渲染表现进行增强。它引入的3D 平滑滤波器和2D 盒式滤波器策略有效地解决了原始3DGS在放大效果下的伪影和交叠问题，而这部分内容仍然是当下学术界研究的前沿。本章的内容主要包括：

第四章：动态场景重建4DGS

第四章会讲解三个动态场景重建的工作。动态场景重建能够建模物体随时间运动的变化，世界不是静止的，物体在移动，色彩在变化。4DGS就像行走在时间上的舞者，在每个时刻都有自己独特的表现。本章选取CVPR2024的满分文章Deformable GS来作为项目实战，来让大家对可变形场有个清晰的认识，也为之后的课程大作业打好基础。本章的内容主要包括：

第五章：场景表面重建-2DGS

第五章会着重介绍基于3DGS进行场景表面重建的三个相关工作。通过场景的表面重建，可以对自动驾驶场景进行物理编辑，比如添加车辆，行人等物体。本章选取当前基于3DGS的SOTA方案PGSR来让大家深入了解场景表面重建的一些基本环节，本章的内容主要包括：

第六章：自动驾驶场景重建-混合GS

第六章则聚焦在自动驾驶场景，对将动静态场景混合情况下的3DGS进行优化的三个工作进行深度解读。只有重建出完整的场景，才能进行场景编辑，进而才能实现闭环仿真。自动驾驶场景的重建涉及到动静态物体分解，所以本章选取Street Gaussians项目作为实战来带大家熟悉基本的分解策略。本章的内容主要包括：

第七章：课程大作业

第七章是课程实战的精华部分，3DGS未来还有哪些研究方向？驾驶场景如何优化？工业界&科研最常用的算法框架是哪个？为此，我们选择了当下应用最广泛的gsplat，其对3DGS的pytorch版本进行了代码重构的开源项目，并提升了原版代码的训练效率，且仓库十分活跃，目前已经支持很多主流算法，非常适合科研及工程应用。本课程的大作业会带着大家从头到尾实现一个基于gsplat的驾驶场景重建的算法设计。

第八章：升学和求职模块

第八章是课程的应用模块，主打升学和求职的经验分享。工欲善其事必先利其器，有了前面七个章节的『器』，咱们在第八章终于可以做『事』了。有了算法经验和工程经验，如何进一步升学和求职呢？需要做哪些准备？3DGS在学术界的研究趋势和工业界的落地现状如何了？目前还有哪些问题仍未解决？在这一章节，老师都会毫无保留的分享给大家。