Stable Diffusion的应用与模型生产部署
1. SDXL Turbo
1.1 背景
SDXL(Stable Diffusion Extra Large)能生成 1024x1024 的高清图像,但由于模型规模大且去噪步骤多,生成图像耗时较长。SDXL Turbo 旨在解决这一问题,在保持图像一致性的同时减少生成时间。
1.2 架构
SDXL Turbo 的训练步骤如下:
1. 从预训练数据集(Large-scale Artificial Intelligence Open Network,LAION,可访问 https://laion.ai/blog/laion-400-open-dataset/)中采样图像和对应的文本。
2. 向原始图像添加噪声(所选时间步可以是 1 到 1000 之间的随机数)。
3. 训练学生模型(对抗扩散模型),使其生成的图像能够欺骗判别器。
4. 进一步训练学生模型,使输出与教师 SDXL 模型的输出非常相似(将学生模型添加噪声后的输出作为输入传递给教师模型)。这样,我们优化了两种损失:判别器损失(学生模型生成的图像与原始图像之间)和学生模型与教师模型输出之间的均方误差损失(MSE 损失)。
graph LR
A[采样图像和文本] --> B[添加噪声]
B --> C[训练学生模型欺骗判别器]
C --> D[训练学生模型匹配教师模型输出]
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



