2024年了CV还有什么可以卷的吗？

最新推荐文章于 2024-10-18 20:31:03 发布

转载最新推荐文章于 2024-10-18 20:31:03 发布 · 264 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247601823&idx=4&sn=7a5bc4f08a8960ddfd7fb1775cd782dc&chksm=cfe2421279b2b33145f42c6edfa1c5c23128ea1620594de71b39f10cd9a7266d23e078940bca&scene=126&sessionid=0

作者 | 清风似少年编辑 | 汽车人

原文链接：https://www.zhihu.com/question/646965266/answer/3461801393

点击下方卡片，关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近15个方向学习路线

>>点击进入→自动驾驶之心『全栈算法』技术交流群

本文只做学术分享，如有侵权，联系删文

不知道啊，我已经以身入局了

我最近就在研究3d gaussian splatting，看相关的论文，复现代码

一、基本介绍

我是去年刚入学的研究生，我们实验室、有16张显卡，主攻方向就是各种图像，然后三维重建这个方向是我一个学长带我入门的，他的毕业论文方向就是三维重建，我是从NeRF开始对三维重建感兴趣的，所以我就一路看论文、复现论文，从NeRF、mip-NeRF、mip-NeRF 360,到现在的3D Gaussian Splatting、mip-3D Gaussian Splatting等等

学习资料整理

vscode代码复现

展示一下我做的一些工作，其中包括渲染结果、导入虚拟引擎、编辑3DGS（去除伪云）和最新论文介绍，并且我会不断更新我的学习经历：

www.zhihu.com/question/626506306/answer/3454762596?utm_psn=1761672668514881536

另外一篇回答详细讲解了我的数据获取过程和技巧：

www.zhihu.com/question/632773209/answer/3463714670?utm_psn=1762176178776264704

二、个人观点

我觉得这个技术真是个好技术，他仅用消费级显卡、较短的时间成本，能得到非常好的重建效果。因此，我认为未来会在各行各业，产生革命性影响，尤其是无人驾驶、VR、医学成像等行业

3dgs导入虚幻引擎

然后，就我自身了解，这个方向确实会非常卷，在NeRF上尝试的各类方法，感觉都会在3DGS上尝试一遍，基本上和萝卜坑一样，所以确实是研究越快越好，很有可能自己刚刚入门，发现人家都发表完了。

不过我觉得这个技术本身还是很前沿的，做一些可编辑性研究或者实际应用性研究，也是能水一篇论文的，我感觉我可能就是这个方向，因为我就是对这个技术的应用很感兴趣。

比如，可以将Sora和3DGS结合、3DGS与各种实际行业的结合、又或者编辑3DGS模型、转Mesh等等

三、三维重建入门

如果初学者刚入门三维重建，可以先从摄像几何开始，了解基本的成像原理，相机内参外参；然后搞懂三维重建的基本原理、相机位姿的提取原理

再去精读NeRF那篇论文（必读），理解神经辐射场，显式、隐式以及3DGS三种辐射场的区别；再去分步理解位置编码、体渲染，采样方式等；然后自己复现NeRF（构建自己的数据集），再将代码和公式对照着看

NeRF

简而言之，不要一上来的就啃论文，会很晦涩难懂，但是当你把它分成了各种模块去学习，再回过头看，各种公式、方法其实就懂了。

NeRF复现看这篇完全够用：

zhuanlan.zhihu.com/p/576416530?utm_psn=1761845070041382912

我是一步一步按照这位大佬学习，他基本上把所有可能遇到的错误都考虑到了，而且非常热心，帮我解决了数据集问题。

四、3DGS学习

我认为知乎上的解读论文比较好的是这一篇：

www.zhihu.com/question/626506306/answer/3375816824?utm_psn=1761848533185843200

然后代码复现我认为真的不算很难，我认为最难的可能是在自己服务器部署COLMAP，这个手动编译会遇到无数问题。我花了四天才搞定，解决所有基础问题前提，最后一步一定要把anaconda3名字改了,才能编译成功。

五、未来展望

我也是刚入门三维重建，各位大佬觉得哪里有问题的一定要指出，及时改正。

投稿作者为『自动驾驶之心知识星球』特邀嘉宾，欢迎加入交流！

① 全网独家视频课程

BEV感知、毫米波雷达视觉融合、多传感器标定、多传感器融合、多模态3D目标检测、车道线检测、轨迹预测、在线高精地图、世界模型、点云3D目标检测、目标跟踪、Occupancy、cuda与TensorRT模型部署、大模型与自动驾驶、Nerf、语义分割、自动驾驶仿真、传感器部署、决策规划、轨迹预测等多个方向学习视频（扫码即可学习）

网页端官网：www.zdjszx.com

② 国内首个自动驾驶学习社区

国内最大最专业，近3000人的交流社区，已得到大多数自动驾驶公司的认可！涉及30+自动驾驶技术栈学习路线，从0到一带你入门自动驾驶感知（2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪）、自动驾驶定位建图（SLAM、高精地图、局部在线地图）、自动驾驶规划控制/轨迹预测等领域技术方案、大模型、端到端等，更有行业动态和岗位发布！欢迎扫描下方二维码，加入自动驾驶之心知识星球，这是一个真正有干货的地方，与领域大佬交流入门、学习、工作、跳槽上的各类难题，日常分享论文+代码+视频