责编 | 梦依丹
出品 | 优快云(ID:优快云news)
在生成式 AI 重塑 3D 内容创作流程的浪潮中,一场场技术革新正悄然改变游戏、美术、影视等产业的生产底座。
作为最受欢迎的 3D 开源模型之一,混元 3D 模型在 Hugging Face 平台下载量已超过 230 万,广受全球开发者认可。
在 2025 世界人工智能大会腾讯论坛上,腾讯正式发布并开源其全新「混元 3D 世界模型 1.0」,该模型不仅支持通过文本或图像生成完整 3D 场景,还具备 360° 沉浸式漫游、资产导出为标准 mesh 格式、支持主流建模软件编辑等功能,真正实现从“AI 能画”到“人能用”的跃迁。
话不多说,直接展示:
在今年 4 月的 2025 全球机器学习技术大会上,腾讯混元 3D 项目负责人郭春超接受 优快云 专访时就提到:腾讯混元 3D 系列模型正从“重建一个物体”到“生成一个场景”,再到“理解一个世界” 迈进,他们希望生成的不只是一个‘看起来像’的模型,而是一个创作者可以直接使用的可交付资产。
在短短几个月的时间,混元 3D 模型就实现了从单物体生成迈向完整场景的生成。
近日,郭春超老师在接受 优快云 线上采访时表示:当前的核心目标是生成稳定、可信的三维场景,这是虚拟游戏与具身智能仿真等应用的基础。混元 3D 世界模型 1.0 的发布,标志着我们在“从物体到场景”这一阶段实现了初步突破。
下一步,他们将引入更多交互能力,如融合 VR、AR 等技术,进一步推动世界模型从“场景生成”迈向“世界理解”。
混元世界模型 1.0 应用概览(VR,游戏开发,场景编辑,物理仿真等)
为了更直观了解混元 3D 世界模型 1.0 的实际使用效果,我们也邀请了 优快云 博客专家、虚幻官方授权讲师、Unity 认证开发者、某高校游戏开发课程教师“老王”进行了深度体验,并给出了一些真实反馈建议:
1、模型在生成全景图时响应较快,整体构图和细节呈现令人满意,尤其是在风格化场景下表现突出,初步展现了良好的艺术泛化能力。
2、从实际测试示例来看,输出 mesh 面数较多,部分不可见区域未作裁剪处理,需要多次调整尝试,建议未来加强几何简化优化,以更适配游戏引擎的实时性能需求。同时,希望官方能在预览引擎中加入多种专业视图模式(如线框、白模等),便于开发者更方便进行模型审查与调整。
打开 3D 世界生成新维度:一句话创造可漫游的 3D 世界
作为业界首个开源、兼容 CG 工业生产管线的 3D 世界生成模型,混元 3D 世界模型 1.0 不仅面向科研圈、开发者和 AI 爱好者,更真正对接了游戏开发、物理仿真等高标准场景需求。
自研的层次化 3D 场景表征及生成算法,支持 3D Mesh 导出,在保证生成场景的逼真度和沉浸感的同时,兼容已有 CG 管线进行二次开发,如游戏开发、物理仿真、场景编辑等。
混元世界模型1.0方法流程图
腾讯混元 3D 世界模型 1.0:
Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
项目主页:https://3d-models.hunyuan.tencent.com/world/
体验地址:https://3d.hunyuan.tencent.com/sceneTo3D
Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1
其核心能力亮点如下:
全景生成,一步成“世界”:相比以往模型只能生成“一个角落”的局部视角,混元支持直接构建完整的 360° 世界场景,四周内容连续、空间感强,具有更强沉浸感与拓展性。
结果可导出、可编辑,真正“能用”:模型输出的内容不仅是“看图”,而是结构化的 3D mesh 网格数据,可一键导出并无缝对接到 Blender、Unity、Unreal Engine 等主流工具中,真正走向 CG 生产环节。
此外,模型采用自研的“层次化 3D 场景生成算法”,将前景物体、背景地形、天空层等自动区分,使后续二次编辑更加灵活。
可交互,可漫游:与传统的 2D 全景图不同,混元生成的是“可探索”的 3D 世界。用户不仅可以原地观察,还可以在其中自由移动、视角切换,实现“人在场景中”的沉浸式体验。
多模态输入支持:支持“文字生成场景”“图像生成场景”等多种输入方式,适配创作者不同工作流程。
此外,腾讯混元团队也从定量角度评估混元世界模型 1.0 性能,针对 360° 全景与 3D 场景生成能力,与开源或者开放接口工作进行了对比,包括纹理细节、美学质量、指令遵循等评价维度,结果显示,混元世界模型 1.0 在生成质量上全面超过了 SOTA 开源模型。
文生 360° 全景指标
图生 360° 全景指标
文生 3D 场景指标
图生 3D 场景指标
据介绍,除本次发布即开源的混元 3D 世界模型 1.0,混元还将在月底开源一系列小尺寸模型,包含 0.5B、1.8B、4B、7B 混合推理模型,更轻量、好部署。在 LMArena Vision 榜单拿下国内第一的多模态理解模型混元-large-vision,以及专为游戏场景优化的交互式游戏视频生成框架混元 GameCraft 等也将于近期对外开源。(投稿或寻求报道:zhanghy@youkuaiyun.com)
📢 AI 产品爆发,但你的痛点解决了吗?
2025 全球产品经理大会
8 月 15–16 日
北京·威斯汀酒店
互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人
12 大专题分享,洞察趋势、拆解路径、对话未来。
立即扫码领取大会PPT
抢占 AI 产品下一波红利