谷歌DeepMind联手牛津推出Bolt3D：AI秒速3D建模革命！单GPU仅需6秒生成3D场景

蚝油菜花

于 2025-03-27 22:17:09 发布

阅读量318

点赞数 3

分类专栏：每日 AI 项目与应用实例文章标签： 3d 人工智能开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_19841021/article/details/146573345

版权

每日 AI 项目与应用实例专栏收录该内容

659 篇文章

订阅专栏

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

🕶️ 「别让显卡燃烧生命！谷歌把3D建模压缩到一次深呼吸」

大家好，我是蚝油菜花。这些数字创作的至暗时刻你是否经历过——

👉 为游戏场景建模连续渲染48小时，显卡哀嚎到能煎牛排
👉 客户临时要改建筑方案，传统流程直接让deadline提前升天
👉 VR内容制作成本高到让投资人瞳孔地震…

今天要炸裂3D界的 Bolt3D ，正在重写物理法则！谷歌这柄「时空剪刀」：

✅ 光年加速：6.25秒吃图吐3D，比泡面计时还快3倍
✅ 量子塌缩术：单张照片自动补全360°细节，连阴影角度都符合物理
✅ 平民造物主：浏览器直接操作3D高斯粒子，无需专业工作站

已有游戏厂用它日更场景，建筑师靠AI实时修改方案——你的创造力，是时候突破「三维速度禁区」了！

🚀 快速阅读

Bolt3D是由牛津大学和谷歌联合开发的3D场景生成技术。

核心功能：支持从单张/多张图像6秒生成高保真3D场景，具备多视角泛化能力
技术原理：结合几何多视角扩散模型+高斯溅射技术，通过三阶段训练实现高效生成

Bolt3D 是什么

bolt3d-cover

Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术，采用潜在扩散模型架构。它能在单个 GPU 上，仅需不到七秒的时间，直接从一张或多张图像中采样出完整的3D场景表示。

该技术的突破性在于将传统需要数小时甚至数天的3D建模过程压缩到秒级。在英伟达 H100 图形处理单元上的实测显示，Bolt3D 仅需 6.25 秒就能将普通照片处理成可交互的三维场景，为游戏开发、虚拟现实等领域带来革命性变化。

Bolt3D 的主要功能

极速生成：前馈式生成架构，单GPU 6.25秒完成3D场景构建
多视图兼容：支持1-N张输入图像，自动补全未观测区域内容
高保真输出：基于高斯溅射技术，每个3D高斯函数记录位置/颜色/透明度等完整属性
实时交互：生成场景可直接在浏览器中查看和渲染

Bolt3D 的技术原理

多视角扩散模型：联合建模图像和3D点图，学习目标图像与点图的联合分布
几何VAE编码：通过特定几何损失函数压缩点图数据，保持高精度
高斯头部模型：输出3D高斯的细化颜色/不透明度/协方差矩阵
三阶段训练：依次训练几何VAE、高斯头部和潜在扩散模型
大规模数据集：应用SOTA密集重建技术生成多视图一致训练数据

资源

项目官网：https://szymanowiczs.github.io/bolt3d

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。