大家好,这次又来给大家更新SD forge插件的教程了。今天给大家介绍的插件名称为Perturbed Attention Guidance(以下简称为PAG),该插件是一款进阶性质的插件是可以给生成出来的图片增加画面细节的。
观前提醒:本教程的使用是建立在使用算网云算力租赁平台提供的SD Webui forge镜像的基础上展开的,平台的网址会在文末展示。
首先要说明的一点是PAG(译名集成干扰注意力引导)到底是做什么的,按照官方介绍,扰动注意力指导显著提高了扩散模型的样本质量,而无需外部条件(例如类标签或文本提示)或额外训练。这在无条件生成设置中特别有价值,因为无分类器指导 (CFG) 不适用。我们的指导可用于增强利用无条件扩散模型的各种下游任务的性能,包括带有空提示的 ControlNet 和超分辨率和修复等图像恢复任务的使用场景。
首先,我们要进入算网云的工作后台界面,这里就像是整个操作的 “控制中枢”。在此,我们需要进行一系列关键操作。在众多选项中,准确选择 GPU 这一步至关重要,这就如同为后续工作挑选了一个强劲的 “动力引擎”。选好 GPU 后,我们就可以部署所需的镜像了,接着便是耐心等待容器实例的部署。这是一个需要些时间的过程,大家要保持耐心。当看到部署状态显示为 “进行中” 时,就意味着我们离成功更近了一步,此时可以点击 “Webui” 进入镜像。
首先为了更好的演示我们需要先生成一张人像图片来作为样本,采样方式和调度类型按照自己的个人喜好就可以了,我一般选择DPM++2M和karras,这个组合的出图效果是算是比较优秀的,提示词方面正向提示词是1girl,portrait,crossed hands,upper_body,负面提示词是随便输的,比如画面质量和减少肢体数量这种通用的提示词。可以看到生成的底图生成的肢体结构是有很多的问题,并且整体的细节也是不足的。然后需要固定图片的生成种子数,可以直观的看出使用插件后的图片差异。
接下来启用插件PAG插件默认值为3,可以看到重新生成的图片在手指结构的方面变得更加贴合实际,并且指甲与毛衣也都添加了相当多的细节,可以说让整张图片的质量获得了提升。
这时候再把插件的数值调整到0,可以看到这个时候的图片效果细节消失了很多,虽然手指的大体结构方面没有什么大的问题,但是手指的指甲却显得非常怪异,手指甲趋向于无,感觉是一种血肉的感觉。这就是PGA插件在启用的时候数值设置的太低了。
然后在插件的数值调整之最大的100,可以看到这个状态的图片,从头发五官和面部这些地方来看画质的细节增加了很多,但关键词中交叉的手注意关键词却已经消失不见了,完全没有跟手部有关的东西了。这就是这个插件存在的一个问题,那就是数值调的太高就会造成画面的一个崩坏。
根据测试的结果,再不扭曲提示词的限定条件下,这个值最大的调整范围是20,如果超过了这个区间手指交叉这个画面效果就显示不出来了,所以实际上该插件的调整区间就是0-20之间,下图是调整值为20的效果。
以上就是PAG插件的使用说明了。总体来说,对于画面效果还是有提升的,对不同大模型的兼容性也还不错,推荐尝试一下,可以和其他插件一起使用,以获得更好的图片效果。本次教程也接近尾声。希望大家通过这次教程,能够对forge的功能有更深入的理解和掌握。下一次,我们再来为大家介绍forge的其他有趣功能,期待与大家下次再见!
算网云平台网址:www.aicpn.cn