混元3D再升级，推出业界首个美术级3D生成大模型，大幅提升布线质量

最新推荐文章于 2025-11-24 17:06:07 发布

转载最新推荐文章于 2025-11-24 17:06:07 发布 · 435 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwMzYwMjkzOQ==&mid=2247494236&idx=1&sn=f0ff03e17c8542d9b889c22a47d992ab&chksm=97ca8c7d5f88af378f623043a82650647a16ff7f65a8cf95655fda4e1c81a78ac872494e5c5f&scene=126&sessionid=0

文章标签：

#3d

7月7日，腾讯混元3D再次升级，带来了业界首个美术级3D生成大模型Hunyuan3D-PolyGen。

结合自研高压缩率表征BPT技术，该模型可生成面数达上万面的复杂几何模型，布线精度更高，细节更丰富，同时支持三边面和四边面，满足不同专业管线需求。基于此，混元3D资产可无缝应用于UGC游戏资产生成，显著提升美术师建模效率。

目前，该能力已上线腾讯混元 3D AI 创作引擎（体验地址：3d.hunyuan.tencent.com），欢迎体验，该技术也集成到腾讯多个游戏管线，助力美术师建模效率提升超70%。

模型主要是为解决3D资产生成中布线质量和复杂物体建模的难题，提升美术师建模效率。

当前，3D生成算法在几何建模方面已取得显著进展，但生成的模型与美术制作的专业标准仍存在明显差距，难以直接应用于游戏开发等专业管线。

图1. 3D生成Mesh vs 美术Mesh

主要问题体现在以下三个方面：

面数过高：生成网格（Mesh）的面片数量动辄高达数十万，无法满足游戏实时加载与渲染的需求。
布线质量欠佳：网格布线杂乱无章，影响模型美观度，并对后续的UV展开、骨骼绑定等环节造成阻碍。
编辑难度大：生成结果为单一整体网格，难以拆分，限制了美术师的后期编辑能力。

为解决以上问题，PolyGen做了一系列的技术创新。

1.算法框架

为实现从“可看”到“可用”的3D生成，Hunyuan3D-PolyGen采用自回归网格生成框架，通过显式、离散的顶点与面片建模，进行空间推理，生成高质量、符合美术规范的3D模型。其核心框架（见图2）包括以下三个步骤：

网格序列化：将网格的顶点和面片转化为Token序列，用以表示Mesh结构。
自回归建模：以点云作为输入Prompt，利用自回归模型生成Mesh的Token序列。
序列解码：将生成的Token序列反向解码为顶点与面片，重建3D网格。

图2. Mesh自回归生成框架

2.技术难点与解决方案

难点一：对于复杂物体的建模

解决方案：自研高压缩率表征BPT

现有的mesh自回归方法，表达一个面通常需要9个token（一个面片三个顶点，每个顶点三个坐标），mesh表达冗余程度高，在给定有限的上下文窗口下，仅可对低面片（2k面以下）的简单模型进行建模，为了提升可建模面数，实现复杂mesh建模，我们自研了高压缩率mesh表征BPT（Blocked and Patchified Tokenization)，设计block索引和patch压缩，使表达相同 mesh 所需的token序列更短，如下图所示：