底层原理
扩散算法
从生成噪点到去除噪点的过程
CLIP(翻译)
Text Encoder文本编码器的一种,把人类的语言翻译成计算机理解的语言
文本信息(关键词)->数字化描述(函数/向量)
CLIP算法根据模型训练数据/经验/参数,大概感知到需要的特征
Latent Space(压缩)
翻译后的语言会进入到Latent Space里面,潜空间。压缩的过程,将512x512x3压缩为64x64x4
采样器、调度器、CFG Scale在潜空间内工作
U-net(去噪)
对随机种子生成噪声图进行引导
Seed
随机种子
随机种子阈值:0-4294967295
VAE解码器(解压)
通过VAE解码器进行解码
基础操作
左键双击背景进行搜索节点
左下角打开设置
左上角点开工作流可以保存
编辑
管理器
队列
节点库
模型库
工作流
搭建文生图基础工作流
加载器
核心是大模型,定义图片风格
调用任何模型都需要加载器
文本编码器
采样器
随机种子:SD渲染时用到的随机噪声
完全随机就把随机种调到0
运行后操作:
固定:每次生图都是同样的种子
增加:每次生图时种子数字+1
减少:每次生图时种子数字-1
随机:每次生图时完全随机的数字
步数:代表每次生图时降噪多少次数
推荐30-40
CFG:代表关键词和图片的相关性
数值越高,图片和关键词的相关性就会越高,建议3-9
采样器:推荐euler a
dpmpp_2m_sde百搭
调度器:
是图片在降噪时的变化曲线
正常:匀速降噪
karras:曲线降噪
exponential:极速降噪
降噪:
就是重绘幅度denoising,文生图默认值保持1,图生图时,数值越高,和原图越不相近
Latent
1.5版本大模型:范围512-768之间
2.1版本大模型:768-1024之间
SDXL/SD3版本大模型:1024上下
VAE解码
生成框
1girl, eating ice cream while walkinig on the beach
embedding:EasyNegative,
VAE加载器
可以理解为滤镜
网站推荐
Create Art or Modify Images with AI
LiblibAI-哩布哩布AI - 中国领先的AI创作平台
Civitai: The Home of Open-Source Generative AI
ComfyICU - Serverless ComfyUI Cloud