3D 生成大模型全流程开源！腾讯 Hunyuan3D-2.1 解锁工业级生产：几何纹理双优化！

原创于 2025-08-12 18:27:34 发布 · 1k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#3d #人工智能 #深度学习 #大模型

01 | Hunyuan3D-2.1模型全链路开源

在计算机视觉的国际顶级会议CVPR上，腾讯开源了Hunyuan3D-2.1模型。这也是首个全链路开源的工业级3D生成大模型。

输入一张图片就能得到一张纹理清晰的3D图，适用于游戏、影视和设计等场景。

腾讯这次一开源就是大手笔，模型权重、训练代码、数据处理流程、部署教程全部开源。方便开发者和创作者在本地部署，根据自身需要定制与微调。

02 | Hunyuan3D-2.1的组成及性能评估

模型组成

Hunyuan3D-2.1由两个基础模型组成，包括用于形状生成的Hunyuan3D-DiT模型以及用于纹理合成的Hunyuan3D-Paint模型。

这次的质感相较于上一版本提升了很多。

这是因为几何模型采用改进的DiT扩散架构，能够生成更加精细的轮廓和细节，结构清晰、边缘干净。

Hunyuan3D-Paint模型引入了PBR（基于物理的渲染）技术，能生成更加真实的金属、木制、陶瓷质感的图片。

性能评估

Hunyuan3D-2.1 的性能评估主要从3D 形状生成、纹理合成和完整 3D 资产创建三个维度展开，通过定量指标和视觉对比，与多个开源及商业模型进行了全面比较，结果表明其在几何细节、纹理保真度和多视图一致性上均表现优异。

🔺3D形状生成评估：

团队对比了Direct3D-S2、Step1X-3D、TripoSG 等开源模型。对比模型（如 Step1X-3D）存在几何模糊或结构缺失，而 Hunyuan3D-DiT 生成的形状细节更清晰。

🔺纹理合成评估

团队对比了SyncMVD-IPA、TexGen、Hunyuan3D 2.0 等图像到纹理模型。

Hunyuan3D-Paint 在纹理的语义一致性（CLIP-I）和感知真实性（CLIP-FID、LPIPS）上均优于对比模型。

🔺完整 3D 资产创建评估

团队对比了开源模型Step1X-3D、3DTopiaXL以及商业模型Model 1、Model 2。

Hunyuan3D-2.1 生成的 3D 资产在几何细节（如锐利边缘、复杂曲面）和纹理保真度上均优于对比模型。

对比模型常出现 “几何粗糙 + 纹理模糊” 的问题（如 Step1X-3D 的网格存在孔洞，Model 2 的纹理颜色失真），而 Hunyuan3D-2.1 实现了两者的平衡。

03 | 使用方法与实测

Step1：安装基础依赖

环境要求：

●Python 3.10

●PyTorch 2.5.1+cu124（需支持 CUDA 12.4 的 GPU，如 A100）

●至少 29GB VRAM（shape+texture 生成），建议使用 A100 40GB 或更高显存 GPU 以确保流畅运行

操作步骤：

# 安装 PyTorch（CUDA 12.4 版本）
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124  
# 安装项目依赖
pip install -r requirements.txt

Step2：编译自定义渲染器

# 进入自定义渲染器目录并安装
cd hy3dpaint/custom_rasterizer  
pip install -e . 
cd ../..  
# 编译可微渲染器
cd hy3dpaint/DifferentiableRenderer  
bash compile_mesh_painter.sh 
cd ../..

Step3：下载预训练模型权重

Hunyuan3D-Shape-v2-1（3.3B，图像转 3D 网格）

Hunyuan3D-Paint-v2-1（2B，纹理生成）

下载方式：

# 下载超分辨率模型（用于纹理优化）
wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P hy3dpaint/ckpt S

Step4：代码调用示例

生成流程：图像 → 3D 网格 → 纹理渲染

import sys
sys.path.insert(0, './hy3dshape')  # 导入形状生成模块
sys.path.insert(0, './hy3dpaint')  # 导入纹理生成模块
# ① 生成未纹理化的 3D 网格
from hy3dshape.pipelines import Hunyuan3DDiTFlowMatchingPipeline
shape_pipeline = Hunyuan3DDiTFlowMatchingPipeline.from_pretrained('tencent/Hunyuan3D-2.1')
mesh_untextured = shape_pipeline(image='assets/demo.png')[0] 
# ② 生成纹理并渲染
from textureGenPipeline import Hunyuan3DPaintPipeline, Hunyuan3DPaintConfig
paint_pipeline = Hunyuan3DPaintPipeline(Hunyuan3DPaintConfig(max_num_view=6, resolution=512))
mesh_textured = paint_pipeline(mesh_path=mesh_untextured, image_path='assets/demo.png') S

Step5：启动 Gradio 可视化界面

无需代码，一键启动 Web 应用：

python3 gradio_app.py \
  --model_path tencent/Hunyuan3D-2.1 \
  --subfolder hunyuan3d-dit-v2-1 \
  --texgen_model_path tencent/Hunyuan3D-2.1 \
  --low_vram_mode

具体内容可见Github：

GitHub - Tencent-Hunyuan/Hunyuan3D-2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material