sd-perturbed-attention:为图像生成提供更优引导
项目介绍
sd-perturbed-attention 是一个基于 ComfyUI 和 SD WebUI 的扩展,实现了 Self-Rectifying Diffusion Sampling with Perturbed-Attention Guidance 算法。该算法通过在图像生成过程中引入扰动注意力引导,从而提升图像的结构连贯性和细节表现力。
项目技术分析
sd-perturbed-attention 采用了 Self-Rectifying Diffusion Sampling 算法,结合扰动注意力引导(Perturbed-Attention Guidance,简称 PAG),在图像生成过程中提供了更加灵活和精细的控制。PAG 通过调整注意力机制,在图像的不同生成阶段引入不同的引导,从而优化图像质量。
项目中涉及的几个关键参数包括:
- scale:PAG 的规模参数,类似于 CFG(Clarity Factor Guidance)的规模参数。较高的值可以增强图像的结构连贯性,但也可能导致过饱和或图像炸裂。
- adaptive_scale:PAG 的阻尼因子,用于在去噪后期对 PAG 进行惩罚,从而提高整体速度。值为 0.0 时表示无惩罚,1.0 时完全移除 PAG。
- unet_block:应用 PAG 的 U-Net 部分,原始论文建议使用中间层。
- unet_block_id:在选定的 U-Net 部分中,应用 PAG 的层的 ID。PAG 只能应用于包含自注意力块的层。
项目及技术应用场景
sd-perturbed-attention 适用于多种图像生成场景,包括但不限于以下几种:
- 艺术创作:艺术家可以通过调整 PAG 参数,创作出具有独特风格和更高细节的图像。
- 游戏开发:游戏开发者可以使用 sd-perturbed-attention 生成高质量的纹理和场景,提高游戏视觉效果。
- 虚拟现实:在虚拟现实场景中,使用 sd-perturbed-attention 可以生成更加逼真的环境和物体。
项目特点
sd-perturbed-attention 具有以下显著特点:
- 高度可定制性:用户可以根据自己的需求调整多个参数,实现个性化的图像生成效果。
- 兼容性强:sd-perturbed-attention 可以与 ComfyUI 和 SD WebUI 无缝集成,支持多种版本的稳定扩散模型。
- 高性能:在不使用
adaptive_scale
参数的情况下,sd-perturbed-attention 的采样速度与 Self-Attention Guidance 相当,约为常规速度的 0.6 倍。
以下是 sd-perturbed-attention 的具体安装和使用方法:
安装
ComfyUI
基本 PAG 节点已包含在 ComfyUI 中,无需安装此扩展,除非您想调整附加参数。要安装来自此仓库的高级 PAG 节点,您可以:
- 将
git clone https://github.com/pamparamm/sd-perturbed-attention.git
复制到ComfyUI/custom-nodes/
文件夹中。 - 通过 ComfyUI Manager 安装(搜索名为 "Perturbed-Attention Guidance" 的自定义节点)。
SD WebUI (A1111 和 Forge)
将 git clone https://github.com/pamparamm/sd-perturbed-attention.git
复制到 stable-diffusion-webui/extensions/
文件夹中。
请注意,A1111 WebUI 的扩展仍在开发中,目前仅支持 Scale
参数。
您可以通过打开/启用 "Override for Hires. fix" 选项卡来覆盖 CFG Scale
和 PAG Scale
。要将 PAG 在 Hires. fix 期间禁用,请将覆盖下的 PAG Scale
设置为 0。
作为 A1111 WebUI 的替代,您可以使用 sd-webui-incantations 扩展中的 PAG 实现。
通过 sd-perturbed-attention,用户可以轻松实现高质量、高细节的图像生成,适用于多种场景和需求。无论您是艺术家、游戏开发者还是虚拟现实设计师,sd-perturbed-attention 都将是您的有力助手。立即尝试,开启您的图像生成之旅吧!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考