刚起步,粉丝不多?这反而让我更敢毫无保留地分享!点击下方卡片「AI 实战家」,每日解锁一个全新 AI 技能 :
核心内容速递
本教程将全方位指导你完成 Stable Diffusion - webui - forge 整合包的下载与安装,深入讲解软件基础操作与实用技巧 。webui - forge 是在原 webui 基础上的升级版本,支持 sd3.5 和 flux 生图功能 。FLUX 所需的 F1 模型、双 clip、VAE 均已放置在对应文件夹,下载后可直接使用;教程中演示用到的麦橘写实大模型和冰雪奇缘 lora 也已配置到位,配合给出的提示词,轻松复刻演示效果。
实测体验
本次演示使用的设备为搭载 4070 显卡、8G 显存的笔记本 。由于 FLUX 对显存要求较高,在该设备上运行会出现显存不足的情况,因此无法进行测试 。我们选择麦橘写实大模型进行绘图演示,大家可参考教程中的参数设置 。如果绘图完成后得到黑色图片,大概率是显存不足导致,可尝试调整图片尺寸;若生成的图片存在噪点,可能是 VAE 设置问题,建议将 VAE 选项留空后再次尝试 。经测试,生成一张 1024×1024 分辨率的图片,大约需要 12.3 秒 。
效果展示
[此处插入图片,可添加文字说明 “滑动查看更多效果”]
整合包获取途径
- 发送【整合包】,即可获取。
- 也可进入【AI 资料】菜单,点击【AI 整合包】进行下载 。
一、整合包下载与安装
将整合包解压至 无中文路径 的文件夹中,具体操作可参照图示 。
二、基础配置
通常情况下,采用默认配置即可正常使用 。若你同时在使用 comfyui,可在 高级选项 > Forge 设置 中,选择 comfyui 的 models,实现两个软件共享同一套模型资源,提升使用效率 。
三、模型存放位置
模型类型 | 存放路径 |
---|---|
大模型 | 根目录 \models\Stable - diffusion |
lora | 根目录 \models\Lora |
VAE | 根目录 \models\VAE |
clip | 根目录 \models\text_encoder |
ControlNet | 根目录 \models\ControlNet |
四、操作实战
-
启动软件:完成配置后,点击控制台的一键启动按钮,等待程序加载完成,加载完毕后会自动跳转至网页界面 。
-
参数选择:在 UI 界面中,全选相关选项,并根据实际情况选择大模型和 VAE(部分大模型已内置 VAE,可无需另行选择) 。
-
输入提示词与 Lora
- 正向提示词:girl,solo,black hair,(blue dress:1.5),looking at viewer,(snow:1.2),snowing,(ice castle:1.2),red lips,blurry background,wind,outdoors,tiara,realistic,(upper part of the body:1.2),snowflakes,(stairs:1.2),long hair,lora:frozen:0.5
- 负面提示词:drawing,painting,crayon,sketch,blurry,deformed,ugly,(deformed iris, deformed pupils, semi - realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4),text,close up,cropped,out of frame,low quality,jpeg artifacts,ugly,duplicate,mutated hands,poorly drawn hands,poorly drawn face,mutation,deformed,blurry,bad anatomy,bad proportions,disfigured,malformed limbs,missing arms,extra arms,extra legs,fused fingers,too many fingers,long neck,((nsfw)),sketches,tattoo,(beard:1.3),(low quality:2),(normal quality:2),normal quality,facing away,looking away,text,error,fewer digits,cropped,jpeg artifacts,signature,watermark,username,blurry,skin spots,acnes,skin blemishes,bad anatomy,fat,bad feet,cropped,poorly drawn hands,poorly drawn face,mutation,deformed,extra legs,too many fingers,long neck,cross - eyed,mutated hands,bad body,bad proportions,text,error,missing fingers,extra arms,missing fingers,(Worst quality,low quality,lowres:1.2),error,cropped,jpeg artifacts,out of frame,watermark,signature
输入提示词后,添加 Lora 并按需调整权重 。
-
参数调整:根据绘图需求,对各项参数进行细致调节 。
-
生成图片:确认所有设置无误后,点击生成按钮,等待图片生成 。
五、常见问题解答
问题 | 解答 |
---|---|
embedding 提示词集合 | 常用于反向提示词,可避免图像出现崩坏等问题,减少手动输入大量提示词的麻烦 |
反向提示词 | 可降低不适内容出现的概率,当图片出现崩坏时,推荐使用特定 embedding(如 NG - DeepNegative - V1 - 75T 修复人体结构、badhandv4 优化手部细节) |
CFG(分类器自由指导比例) | 用于控制模型对提示词的遵循程度 。值过低,模型会忽视提示;值过高,图像颜色会过于饱和 。 1 - 模型大多不遵循提示; 3 - 生成效果更具创意; 7 - 在遵循提示与自由创作间达到较好平衡; 15 - 更严格遵循提示,图片对比度和饱和度增强; 30 - 严格按提示生成,但颜色易过饱和 。 一般取值在 4 - 10 较为合适,具体还需结合迭代步数和采样方法综合判断 |
图片无损放大 | 二次元图像推荐使用 R - ESRGAN 4X + Anime6B 算法;真人图像处理可使用高清化 /extras 功能 |
<> 尖括号 | 主要用于调用 lora,格式为lora: 文件触发:权重 |
clip 终止层数 | ClipSkip 为 1 时,处理至最后一层;为 2 时,处理至倒数第二层;为 3 时,处理至倒数第三层 。值越小,生成图像包含的提示词信息越丰富;值越大,提示词被忽略的越多 |
放大模型 | 相片类:LDSR(速度较慢)或 ESRGAN_4x(追求细节与速度); 绘画类:ESRGAN_4x(写实风格,突出纹理细节)、General - WDN(整体效果更佳); 动漫类:Anime6B(也适用于将图像转换为动画风格) |
Tiled diffusion | - 方案:提供两种算法供选择; - 覆盖图像尺寸:可突破 SD 模型原有限制,生成超大尺寸图像(如超宽幅画面); - 潜空间分块宽 / 高度:即图像中小框的宽高,一般取值 64 - 160,最佳值取决于潜空间分块单批数量和所用模型(建议使用未剪枝模型),通常选 96 或 128; - 潜空间分块单批数量:类似生成图中的 “单批数量”,受显卡性能影响,数值越大生成速度越快,可选范围 1 - 8; - 潜空间分块重叠:数值越高,图像融合接缝越少,但会降低生成速度 。使用 MultiDiffusion 时建议选 32 或 48,使用 MixtureofDiffusers 选 16 或 32 |
Tiled VAE | 该选项可大幅降低 VAE 处理大图时的显存占用 。例如使用 highres.fix,原本只能放大 1.5 倍,开启后可放大至 2.0 倍 。一般无需修改默认参数,仅在以下情况调整: 1. 生成时出现 CUDA 内存不足错误,降低 tile 大小; 2. tile 过小导致图片灰暗模糊,启用编码器颜色修复 |
采样器 | - 老牌采样器: Euler a(每次去噪添加新噪点,生成结果不收敛,每次生成图像有差异); Euler(生成结果最终趋于稳定,可收敛) 。 - DPM 采样器:DPM2 算法虽提升画质,但耗时翻倍,不推荐;带有 Karras 算法的采样器,8 步后噪点明显减少,优先选择 。 - 2S 和 2M 区别:S 为单步算法,M 为多步算法(增加相邻层信息传递),建议选带 M 算法的采样器 。 - 推荐算法: DMP++2M Karras(收敛快、速度与质量俱佳); DMP++SDE Karras(基于随机微分方程,不收敛,画质高但速度慢,适合追求真实感画面); DMP++2M SDE Karras(结合 2M 和 SDE,不收敛,速度有所提升); DMP++2M SDE Exponential(指数算法,不收敛,画面更柔和干净但细节稍少); DPM++3M SDE Karras、DPM++3M SDE Exponential(与 2M 速度相当,需更多采样步数,当 CFG 采样步数 > 30 时效果更佳) 。 - 2023 采样器: Unipc(新采样器,统一预测矫正器,兼容性好,收敛快,约 10 步生成可用画面); Restart(单步渲染时间长,但少量采样步数即可生成高质量图像,潜力大) 。 若追求快速且质量稳定,选 DMP++2M Karras、UniPC;若注重画质不考虑收敛速度,选 DMP++SDE Karras;若需要稳定、可重复的生成效果,避免使用带 a 的采样器;若偏好简单操作,Euler 和 Heun 是不错选择 |
六、实用技巧与案例分享
(一)描述词构成
- 画质描述词 + 画风描述词
- 画面主体内容
- 环境、场景、灯光及构图
- lora 模型
- 负面描述词
(二)关键词权重规则
默认关键词权重为 1,词序越靠前权重越高 。使用括号调整权重时,每层()使权重增加 0.1 倍,每层 {} 增加 0.01 倍,每层 [] 降低 0.1 倍,括号最多嵌套三层 。也可通过(关键词:1.1)直接设置权重,建议取值范围在 0.3 - 1.5 之间 。
(三)特殊采样方法
- 交替采样:格式为 [提示词 1 | 提示词 2] 。例如 girl,upper body,[blue | red] hair,将生成头发红蓝相间的女孩 。
- 渐变采样:采用 [提示词 1:提示词 2:0 - 1 数值] 。如 forest,lots of trees,[stones:flowers:0.7],表示前 70% 按石头采样,后 30% 按花朵采样,生成以石头为主、花朵点缀的森林场景 。
- 控制采样
1:[提示词:0 - 1 的数值]:如 forest,lots of trees and stones,[flowers:0.7],当整体采样进度达到 70% 时,开始按 “flowers” 描述生成,画面中花朵数量较少 。
2:[提示词::0 - 1 的数值]:如 forest,lots of trees and stones,[flowers::0.7],从采样开始就加入 “flowers” 描述,到 70% 进度停止,画面中花朵数量比前者更多 。
(四)下划线的妙用
下划线 “_” 用于连接词汇,避免歧义 。例如 banana cake 可能生成一根香蕉和一个蛋糕,而 banana_cake 则明确生成香蕉蛋糕 。
(五)常见问题解决办法
-
脸部崩坏问题
原因:采样资源分配不均,远景画面分配的采样较少,容易出现脸部崩坏 。
解决方法
-方法一:保持较低图片分辨率,启用高清修复功能将图片放大两倍 。此方法虽能提升分辨率,但会增加渲染时间,且对脸部细节的改善有限 。
-方法二:使用图生图功能,通过蒙版遮盖脸部区域,选择仅对蒙版区域进行处理 。适合单个人脸修复,多人脸时操作量较大 。
-方法三:安装拓展插件 。从https://github.com/Bing - su/adetailer.git 下载插件,在https://huggingface.co/Bingsu/adetailer/tree/main下载 face_yolov8m.pt、face_yolov8n.pt、face_yolov8n_v2.pt、face_yolov8s.pt 等修复人脸模型(had 用于修复手部,person 用于增强人物整体细节),放入 SD 目录 /models/adetailer 。使用时勾选启用 ADetailer,选择合适的修复模型(mediapipe_face_full 仅适用于真人图像),在下方输入框输入 detail face 即可修复脸部,还可添加表情关键词实现更多效果,也可组合使用不同模型进行综合修复 。 -
手指问题
方法一:在生成图片时添加负面提示词,如 “残缺的手指”“六个手指” 等(可参考反向提示词集 bad - hands - 5) 。
-方法二:借助 openpose 骨骼图 。在文生图界面,通过 controlnet 上传图片获取手指姿势,启用完美像素模式,选择 openpos(姿势)控制类型、dw_openpose_full 预处理器和对应 openpose 模型,点击预处理结果生成图片 。若手部效果不理想,可固定种子数,使用 openpose 编辑器调整骨骼图后重新生成 。也可将图片转入图生图,保存骨骼图后加载到图生图的 controlnet(控制类型选 openpose,预处理器选无)再次生成 。若不希望图片其他部分改变,可将图片进行局部重绘,用画笔涂抹手部后,在 controlnet 中导入骨骼图,选择重绘蒙版内容等操作生成最终图片 。还可进行多重控制,结合不同 controlnet 控制类型(如姿势、深度、软边缘)和权重调整,获得理想的手指效果 。
方法三:安装 Depth Library 拓展插件,利用手部模型进行修复 。Stable Diffusion 最强提示词手册
- Stable Diffusion介绍
- OpenArt介绍
- 提示词(Prompt) 工程介绍
- …
第一章、提示词格式
- 提问引导
- 示例
- 单词的顺序
- …
有需要的朋友,可以点击下方卡片免费领取!
第二章、修饰词(Modifiers)
- Photography/摄影
- Art Mediums/艺术媒介
- Artists/艺术家
- Illustration/插图
- Emotions/情感
- Aesthetics/美学
- …
第三章、 Magic words(咒语)
- Highly detailed/高细节
- Professional/专业
- Vivid Colors/鲜艳的颜色
- Bokeh/背景虚化
- Sketch vs Painting/素描 vs 绘画
- …
第四章、Stable Diffusion参数
- Resolution/分辨率
- CFC/提词相关性
- Step count/步数
- Seed/种子
- Sampler/采样
- 反向提示词(Prompt)
第5章 img2img(图生图),in/outpainting(扩展/重绘)
- 将草图转化为专业艺术作品
- 风格转换
- lmg2lmg 变体
- Img2lmg+多个AI问题
- lmg2lmg 低强度变体
- 重绘
- 扩展/裁剪
- …
第6章 重要提示
- 词语的顺序和词语本身一样重要
- 不要忘记常规工具
- 反向提示词(Prompt)
- …
第7章 OpenArt展示
- 提示词 (Prompt)
- 案例展示
- …
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的卡片进行领取!