Stable Diffusion 模型具体如何设置参数？

最新推荐文章于 2025-07-22 21:38:22 发布

原创最新推荐文章于 2025-07-22 21:38:22 发布 · 900 阅读

CC 4.0 BY-SA版权

文章标签：

随机种子（seed）：设置一个固定的随机种子值，可以确保在相同文本提示下生成相同的图像。如果设置为-1，则每次生成的图像都是随机的。
num_inference_steps：控制模型推理的步数。步数越多，生成的图像质量通常越高，但生成时间也会相应增加。通常使用默认值50步，如果需要更快的结果可以减少步数，而更高质量的图像则可以适当增加步数。
guidance_scale：用于调整生成图像对文本提示的忠实度。值介于7和8.5之间通常是稳定扩散的好选择。较高的值会使图像更符合提示词，但可能降低多样性；较低的值则相反。
height和width：设置生成图像的高度和宽度。默认生成512×512像素的图像，如果需要生成矩形图像，建议设置为8的倍数，以避免图像内容被裁剪或缩放错误。

Sampling method（采样方法）：不同的采样方法会影响图像生成的质量和速度。常见的采样方法有DDIM、PLMS等，每种方法在不同场景下表现不同，可以通过尝试找到最适合的采样方法。
Sampling steps（采样步数）：与num_inference_steps类似，采样步数越多，生成的图像质量越高，但生成时间也会更长。通常与采样方法结合使用，以达到最佳效果。

CFG Scale（无分类指导规模）：与guidance_scale类似，用于控制提示词与生成图像之间的相关性。较高的CFG Scale值会使模型更专注于提示词，生成更符合描述的图像，但可能限制图像的多样性。
Restore faces（面容修复）：如果生成的图像是人像，启用此功能可以对人脸进行修复和优化，使面部细节更加清晰自然。
Highres.fix（高分辨率修复）：用于提升生成图像的分辨率和清晰度。通过先生成低分辨率图像，再进行放大和优化，以获得更高品质的最终图像。
Denoising strength（去噪强度）：控制对原始图像的去噪程度。较高的去噪强度会使生成的图像与原始图像差异更大，适用于需要大幅修改的场景。