Krita AI Diffusion 插件中 Flux UNET 模型的快速测试方案

Krita AI Diffusion 插件中 Flux UNET 模型的快速测试方案

krita-ai-diffusion Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. krita-ai-diffusion 项目地址: https://gitcode.com/gh_mirrors/kr/krita-ai-diffusion

背景介绍

Krita AI Diffusion 插件是一个强大的图像生成工具,它基于 ComfyUI 工作流系统。近期开发者们正在为 Flux 模型添加完整支持,但由于技术复杂性,完整的集成需要更多时间。本文介绍了一种临时解决方案,让用户能够提前测试 Flux UNET 模型的加载功能。

技术原理

Flux 是一种新型的扩散模型架构,与传统的 Stable Diffusion 模型不同,它采用了分离的组件设计:

  • UNET:负责主要的扩散过程
  • CLIP:处理文本编码
  • T5:辅助文本理解
  • VAE:负责图像编码和解码

这种分离设计使得模型可以更灵活地组合和优化,但也增加了集成的复杂性。

临时解决方案实施步骤

1. 准备模型文件

首先需要创建一个符号链接或副本文件:

  1. 选择一个已有的 Flux safetensors 完整检查点文件
  2. 将其重命名为特定格式:__unet__<unet文件名>.safetensors
  3. <unet文件名>对应 ComfyUI/models/unet 目录中的实际 UNET 模型文件名

2. 修改插件代码

需要修改 comfy_workflow.py 文件中的 load_checkpoint 方法,添加对 UNET 模型的特例处理逻辑。修改后的代码会:

  • 检测文件名中的 __unet__ 标记
  • 自动加载对应的 UNET 模型
  • 分别加载 CLIP、T5 和 VAE 组件
  • 支持 GGUF 和 NF4 两种量化格式

3. 配置模型路径

在代码中需要配置以下模型路径:

  • CLIP 模型路径
  • T5 模型路径(支持 GGUF 和标准格式)
  • VAE 模型路径

技术细节说明

模型量化支持

目前支持两种量化格式:

  1. GGUF 格式:

    • 优点:内存占用低,稳定性好
    • 缺点:首次生成速度较慢
    • 最新版本已修复 LoRA 加载问题
  2. NF4 格式:

    • 优点:生成速度最快
    • 缺点:不支持 LoRA,高分辨率下内存优势不明显

性能考量

在 8GB VRAM 的系统上:

  • Q6 和 Q4 量化的 GGUF 模型可以正常工作
  • Q8 版本可能因内存不足无法加载 LoRA
  • NF4 版本虽然速度快,但不支持 LoRA

使用建议

  1. 对于测试目的,推荐使用 GGUF Q4_K_S 版本,它在速度和内存占用之间取得了良好平衡
  2. 如果需要更高画质,可以尝试 Q6 版本
  3. 纯速度追求者可选择 NF4 版本,但需注意功能限制

注意事项

  1. 修改代码前请确保了解如何回退更改
  2. 不同版本的模型文件可能有兼容性问题
  3. 修复无缝(seamless)选项需要关闭才能正常使用 Flux 进行修复

未来发展

官方已在 1.24.0 版本中正式加入了对扩散模型(UNET)和 GGUF 格式的支持,未来可能会进一步优化:

  • 统一检查点和 UNET 模型列表
  • 自动检测和加载 CLIP/VAE 组件
  • 更深入的量化格式集成

这种临时方案虽然不够完美,但为技术爱好者提供了提前体验 Flux 模型的机会,也为开发者收集实际使用反馈提供了渠道。

krita-ai-diffusion Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. krita-ai-diffusion 项目地址: https://gitcode.com/gh_mirrors/kr/krita-ai-diffusion

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

巫斐娅

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值