AIGC:Stable Diffusion(一项普通人就能实现的AI前沿科技)的简介、Stable Diffusion2.0的改进、安装、使用方法(文本到图像/图像修改/超分辨率/图像修复)之详细攻略

在小伙伴们私下留言中,关于如何实现人物的全身照一直有人咨询,看来这个问题还是困惑着不少小伙伴,今天我们就这个问题详细讨论一下。

一. 宽高比参数设置

在讨论如何生成图片的全身照之前,我们先来讨论一下Stable Diffusion中宽高比的参数设置。

这2个参数对于最终的出图有非常大的影响。很多小伙伴因为这2个参数的设置不合理导致出来的图片效果很奇怪。

下面是一些小伙伴使用SD1.5的大模型(如majicMIX realistic 麦橘写实_v7)设置不合理的宽高比出的图。

宽高:1080*1920(制作9:16图片)

在这里插入图片描述

下面我们重点看一下常用的SD V1.5和SDXL大模型下宽高比的正常设置范围。

对于SD V1.5 模型最优的宽高比:512x512。下面是常用的宽高比:

  • 1:1(正方形):512x512、768x768

  • 3:2(横向):768x512

  • 2:3(纵向):512x768

  • 4:3(横向):768x576

  • 3:4(纵向):576x768

  • 16:9(宽屏):912x512

  • 9:16 (竖屏): 512x912

对于 SDXL 模型最优的宽高比:1024*1024。下面是常用的宽高比:

  • 1:1(正方形):1024x1024、768x768

  • 3:2(横向):1152x768

  • 2:3(纵向):768x1152

  • 4:3(横向):1152x864

  • 3:4(纵向):864x1152

  • 16:9(宽屏):1360x768

  • 9:16(竖屏):768x1360

宽高比设置注意:

  • 宽度和高度最好能被 8 整除。

  • 记住常用比例:1:1, 2:3(3:2)、3:4(4:3)、9:16(16:9)

  • 如果使用基于SD1.5大模型出图分辨率小的话,可以使用后期放大处理(2倍或者4倍)的方式将图片高清放大。

重点说明: 目前最多的问题是使用基于SD1.5的大模型,将生成图片宽高参数值设置为超过1024大小导致生成的图片千奇百怪,甚至大家参照大模型的案例图片在参数设置完全一致的情况下,图片的效果仍然相差甚远。

主要是很多大模型的案例图片经过了后期放大处理,导致图片宽高超过1024,其实在他们生成图片的时候,都是在正常宽高比参数值下生成的。有些小伙伴不了解相关机制,将后期放大的图片宽高当做生成图片时的宽高参数设置,这样就最终导致生成的图片和案例图片效果相差甚远了。


二. 人物的全身照

关于人物全身图处理方式的几种思路。

(1)在正向提示词中添加关键词full body或者full body shot等

(2)如果没有效果,加大关键词的权重 (full body:1.2) 或者(full body:1.5)

(3)如果还是没有效果,适当调整一下图片的宽高设置,将图片的高度调整为图片的宽度的1-2倍,例如生成图片的宽高比设置为3:4。

(4)如果都没有效果,针对我们使用的大模型,在官网看一下详细的说明,有没有对出全身图有这样的限制,或者看一下官网放出的那几张金典的图片,是否可以作出全身图片,然后看一下提示词以及相关参数设置。

下面我们以下面的文生图为例对上面的关键点展开说明。

  • 大模型:万享XL_超写实摄影V8.2

  • 采样器:Euler a

  • 采样迭代步数:25

  • CFG:3

  • 正向提示词:1 super beautiful chinese girl,solo,(full body:1.5),

  • 反向提示词:NSFW,EasyNegative,badhandv4,

  • ng_deepnegative_v1_75t,16-token-negative-deliberate-neg,bad_prompt_version2,ugly,deformed,bad anatomy,low quality,

关于万享XL模型下载请扫描获取哦

请添加图片描述

full body(全身)关键词的理解

这里以图片宽高1024*1024来说明

一般来说,在提示词中我们使用full body关键词,可能想到的图片效果如下。
在这里插入图片描述

这种是最理想的图片效果,以人物站立姿势来展示全身图的。

由于我们并没有在提示词里面指定人物的姿势,所以使用full body关键词有时候出来的图片效果并不都是站立姿势,比如下面的图片。

坐姿的全身图

躺姿的全身图

身体向前倾的全身图

总结:

(1)关键词full body表示的全身含义,可能包含人物的多种姿势的全身,比如站立、坐姿、躺姿等。所以,如果有时候要表达更为准确的全身含义,需要补充人物姿势的关键词。

(2)关键词full body表示的全身并不一定都是从头到脚都展示。很多时候可能都是大腿以上的部分。

(3)不同的模型对于关键词full body的理解也不一样,有些模型使用full body出图都是站立的全身照,并且从头到脚。比如下面是majicMIX realistic 麦橘写实_v7版本出的图片(提示词和上面一样,宽高为512*512)。

宽高参数值对人物全身照的影响

我们仍然以上面的示例为例,我们将宽高参数值调整为1024*512。

针对万享XL_超写实摄影V8.2,我多次生成了图片,每次图片效果都只有人物的半身照。

这说明,图片的宽高设置对于人物的全身照还是有影响的,如果我们图片的宽高设置不合理,例如本示例中将图片的宽度设置为高度的2倍,出全身图的概率可能会非常小,所以为了更好的实现人物的全身图,可以适当调整图片的宽高设置,将高度调整到宽度1-2倍。

很多时候,将图片的高度设置比宽度大,出现全身照并且人物站立姿势的概率要大很多。

另外,有些摄影的角度可能也会生成人物的全身照,并不需要借助关键词full body, 大家也可以了解一下,当然这些就不在我们讨论的范围之内。

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

需要的可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

请添加图片描述

1.stable diffusion安装包 (全套教程文末领取哈)

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍代码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入门stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

请添加图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值