还记得上个月李飞飞教授那个创业公司World Labs搞出来的“Marble”吗?一张图就能给你造个宏大3D世界,当时就觉得够科幻了。结果!这才几天啊,他们又甩出一个王炸——RTFM模型!

李飞飞团队再放大招!你的显卡能造宇宙了!-1
一、算力平民化
这玩意儿牛在哪?首先,最炸裂的点:它能在单张H100显卡上跑起来! 你没听错,就一块顶级游戏显卡级别的GPU!这意味着昨天你还在为抢不到显卡发愁,今天却发现自己的旧电脑突然能当超级计算机用了。
普通开发者、小团队,未来都可能摸得着、玩得起这种能“凭空造世界”的技术了,想想就热血沸腾!
二、脑补式渲染引擎
那RTFM具体是干啥的?简单来说,它是个“学习型渲染器”。传统3D游戏、电影特效怎么做?得先建复杂的3D模型,然后打光、算阴影、搞反射,最后渲染成2D画面给你看。人工设计的东西多,还贼吃算力。
李飞飞团队再放大招!你的显卡能造宇宙了!-2
RTFM路子就野得很! 它不看那些复杂的3D结构,它就盯着你给它的一张(或几张)2D图片看。比如你给它一张客厅照片,它就能生成从阳台角度看向客厅的画面,连玻璃反光、窗帘阴影都自然得不可思议。
李飞飞团队再放大招!你的显卡能造宇宙了!-3
这种「学习型渲染器」的聪明之处在于——它是一种端到端训练的自回归扩散 Transformer,通过大规模视频数据训练,自己“悟”出了3D空间、光影反射、物体材质的规律,有从业者调侃这是「脑补引擎」,确实贴切。
这背后其实印证了图灵奖得主Rich Sutton那个著名的“苦涩的教训”:真正厉害的技术,往往是那些能随着算力提升而优雅扩展的简单方法。
三、稳定的平行宇宙
它还解决了世界模型的一个大难题——持久性。想象一下。RTFM通过给每一帧画面都“记住”它在3D空间里的位置和朝向(姿态),配合一个叫“上下文调度”的聪明机制,让这个世界真正能长久存在,无论离开多久,返回时场景始终如一。
⭐这技术预示着未来游戏、影视、VR/AR、甚至电商展示、建筑设计等领域都可能迎来翻天覆地的变化。当创造世界的工具变得触手可及,会迸发出怎样的创意火花?想想就让人期待!体验地址:
https://rtfm.worldlabs.ai/
播客地址:https://www.worldlabs.ai/blog/rtfm
📌划重点
- 算力平民化: 单GPU运行顶级世界模型,技术门槛被击穿,创造力大爆发时代来临!
- 脑补成真: “学习型渲染器”从2D图直接脑补3D世界,省去传统建模渲染的繁琐步骤。
- 世界永存: 通过记录姿态和上下文调度,实现虚拟世界的真正“持久性”,体验更真实。
5560

被折叠的 条评论
为什么被折叠?



