PAI-Diffusion中文模型全面升级，海量高清艺术大图一键生成

转载于 2023-06-27 10:33:19 发布 · 136 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://developer.aliyun.com/article/1228506?utm_content=g_1000374475

文章标签：

#人工智能 #深度学习 #计算机视觉 #数学建模 #云计算

阿里云PAI团队对PAI-Diffusion中文模型进行了大幅升级，通过优化预训练数据和训练过程，显著提高了图像生成的质量和风格多样性。此外，结合自研的编译优化工具PAI-Blade，实现了模型推理的加速，在A10机器上达到1秒内生成中文大图。

背景

以Stable Diffusion模型为代表，AI生成内容（AI Generated Content，AIGC）的模型和应用呈现出井喷式的增长趋势。在先前的工作中，阿里云机器学习PAI团队开源了PAI-Diffusion系列模型（看这里），包括一系列通用场景和特定场景的文图生成模型，例如古诗配图、二次元动漫、魔幻现实等。这些模型的Pipeline除了包括标准的Diffusion Model，还集成了PAI团队先前提出的中文CLIP跨模态对齐模型（看这里）使得模型可以生成符合中文文本描述的、各种场景下的高清大图。此外，由于Diffusion模型推理速度比较慢，而且需要耗费较多的硬件资源，我们结合由PAI自主研发的编译优化工具 PAI-Blade，支持对PAI-Diffusion模型的端到端的导出和推理加速，在A10机器下做到了1s内的中文大图生成（看这里）。在本次的工作中，我们对之前的PAI-Diffusion中文模型进行大幅升级，主要的功能扩展包括：

图像生成质量的大幅提升、风格多样化：通过大量对模型预训练数据的处理和过滤，以及训练过程的优化，PAI-Diffusion中文模型生成的图像无论在质量上，还是在风格上都大幅超越先前版本；

完整内容请点击下方链接查看：

PAI-Diffusion中文模型全面升级，海量高清艺术大图一键生成-阿里云开发者社区

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容