简介:
2025年6月27日,全球AI图像编辑领域迎来又一重要里程碑——Black Forest Labs正式开源其新一代图像编辑模型FLUX.1Kontext [dev],这一基于120亿参数流匹配变换器架构的突破性模型,凭借上下文感知的精准编辑能力与消费级硬件适配性,被业界誉为“开源领域对标GPT-4o的颠覆性力量”。
这个模型最大的亮点:直出1280*1920,不会崩。
1、Kontext 模型的不同版本
Kontext 模型有不同版本,可根据需要选择一个下载,其中 原始版本 和 Fp8 版本 在 ComfyUI 中使用和存储位置都是相同的,而 GGUF 版本则需要保存到 ComfyUI/models/Unet/
目录下,并使用 ComfyUI-GGUF 的 Unet Loader (GGUF) 节点进行加载。
Flux.1 Kontext Dev 原始模型权重及社区版本
- Black Forest Labs原始版本:flux1-kontext-dev.safetensors
- ComfyOrg 提供的 FP8 版本:flux1-dev-kontext_fp8_scaled.safetensors
- 社区 GGUF 版本:FLUX.1-Kontext-dev-GGUF
- Nunchaku 加速推理版: nunchaku-flux.1-kontext-dev
Flux.1 Kontext Dev 相关模型的显存需求
Flux.1 Kontext模型开源以后,Dev 模型除了 Diffusion models 之外,其它模型(Text Encoder、VAE)和原来的 Flux 系列的模型是一致的,如果你之前有使用过相关工作流,那么你仅需要下载 Flux.1 Kontext Dev 的相关模型即可。
2、ComfyUI Flux.1 Kontext Dev 原生基础工作流
ComfyUI 官方模板中已经提供了基本应用模板,所以请在 ComfyUI 中找到 Flux.1 Kontext Dev 相关模板即可。这里使用官方介绍内容。
2.1. 工作流及示例素材下载
下载下面的文件,并拖入 ComfyUI 中加载对应工作流
输入图片
2.2. 按步骤完成工作流的运行
你可参考图片中的序号来完成图工作流的运行:
- 在
Load Diffusion Model
(模型加载器)节点中加载flux1-dev-kontext_fp8_scaled.safetensors
模型 - 在
DualCLIP Load
(双Clip加载器)节点中确保:clip_l.safetensors
及t5xxl_fp16.safetensors
或t5xxl_fp8_e4m3fn_scaled.safetensors
已经加载 - 在
Load VAE
(Vae加载器)节点中确保加载ae.safetensors
模型。(本人使用时改了文件名,叫做Flux-ae.safetensors) - 在
Load Image(from output)
节点中加载提供的输入图像 - 在
CLIP Text Encode
节点中修改提示词,仅支持英文 - 点击
Queue
按钮,或者使用快捷键Ctrl(cmd) + Enter(回车)
来运行工作流
3、ComfyUI Flux.1 Kontext Dev 裁剪文生图工作流
下面是本人基于官方工作流的裁剪工作流。
2.1. 文生图演示
裁剪后的工作流如下:可以看到,官方演示版本是基于图生图的。我演示的是基本的文生图,所以我启用了空latent,删除了一些不需要的节点。官方工作流的注释可以要,也可以不要。
2.2. Flux引导
注意:
1)Flux引导串联在Clip文本和正面条件之间。这个意味着对于Flux,真实有效的提示词相关性是由Flux引导决定。
2)所以K采样器中的CFG实际是无效的,官方就给出了1,这个不要改。
在ComfyUI中,Flux引导值(Flux Guidance Scale)是一个重要的参数,它控制了图像生成过程中Flux模型的引导强度(实际就是提示词引导强度)。让我详细解释一下:
Flux引导值的含义:
- 引导值控制生成图像时参考提示词(Prompt)的严格程度
- 值越高,生成的图像越严格地遵循提示词描述
- 值越低,生成的图像会更加自由、创意性更强
推荐设置范围:
- 默认推荐值:4-8
- 低引导值(1-3):图像更加自由,可能偏离提示词
- 中等引导值(4-8):平衡提示词和创造性
- 高引导值(9-12):严格遵循提示词,细节更精确但可能缺乏创意
建议设置(文生图):
- 对于一般图像生成:建议从5-7开始尝试
- 需要高度精确图像:可以尝试8-10
- 需要更多创意空间:可以调低到3-4
2.3.不同 Flux引导示例(以下示例图基于上述基本文生图工作流)
测试环境:
- 主模型:
flux1-dev-kontext_fp8_scaled.safetensors
- 硬件显存:16G
- 提示词:A magical castle glowing in the forest, watercolor style, warm twilight tones, detailed tree textures, soft light filtering through leaves, whimsical architectural elements
- 图片尺寸(这是核心亮点):1280*1920
1)Flux引导=1(实测,清晰度不够)
2)Flux引导=3(实测,尚可)
3)Flux引导=5(实测,有点过拟合)
实际使用中,建议通过多次尝试找到最适合的值。
不同的提示词和期望效果需要不同的引导值。