拒绝低质量!一个技巧,搞定Stable Diffusion高清图片生成

生成高清图片看起来是一件很简单的事情,似乎我们只要给AI设定一个足够高的分辨率,要求就能够达到。

但实际的操作,比我们设想复杂一些。会涉及到一些技术的问题,需要了解背后的逻辑,然后按照用AI绘图的逻辑来解决。

1. Mj与SD在生成高清图片上的差别

首先我们来看一下Mj和SD在生成高清图片上的一些差别。

  • Mj:默认生成的图像,单张图就是1024x1024,单张图就是1M像素的图片。Mj本身不提供更大分辨率放大的功能。

Mj:默认生成4张1024x1024子图

  • SD:基础模型默认生成的图片都是512x512,画面幅度明显偏小。但是提供了更高清图片的增强功能。

SD:默认512x512,子图数量可设置

SD:图片效果

512x512的像素,在我们日常使用中,属于非常低清晰度的画面、完全无法展示出清晰的细节,发朋友圈都不够用,更不用说业务上使用。因此图片的放大增强,是非常必要的操作。

2、SD中直接设置高分辨率的绘图问题

在SD中直接设置高分辨率的绘图会出现一系列的问题。这是一个SD特有的问题,其实关键的原因就在于它默认的模型是适配于512x512的图片大小的,按照这样的一个尺寸来训练的。

那在这种情况下我们直接要求它生成一个1024x1024,甚至2048x2048的图像,一方面会带来一个非常大的GPU计算资源的压力,另外一方面由于画面设置的过大,对原来的模型来说,它可能会认为你这个画面对应的是多张图片,它会拥有类似于拼接或者生成多个物体的方式来进行绘制。

具体来看,绘制的图片出现了严重的缺陷:

  • 图2:一只猫双尾巴,一只猫没身体只露头

  • 图3:两只猫(绘图要求是a cat

  • 图4:双头猫

要解决这个问题,我们就需要用到一个关键技巧——高清修复

3. 高清修复功能:小图定轮廓,大图出高清

设置方式

高清修复(Highres-fix)——这个技术看起来是比较复杂,但是其实逻辑很简单。

在它绘制的过程中,实际上分了两步:

  • 第一步,按照一个小图来绘制,比如512x512。

  • 第二步,将小图按照一定的倍数放大成一个大图,比如说我们将放大倍数设置为2,它就可以将512的图放大到1024。(设置方式也可以是直接指定尺寸)

值得注意的是,【放大】的过程,实际上是【重绘】的操作,但是在这个过程中,它会尽可能的遵循原来图像画面,然后通过重绘的技术,将在更大的像素上,把我们画制出更加清晰的细节。

基本的设定非常简单:

  • 高清修复:需要开启√

  • 重绘幅度:也就是参考小图画面的程度,经验值03~0.7之间是较为稳妥的参数

  • 放大倍率:取决于最终想要的输出质量,比如,从512到1024对应的放大比例是2。经验:最终出图尺寸,避免超过2k x 2,放大幅度过大,画面可能出现变形。

SD文生图:高清修复

关于放大算法,这一块其实我们可以不用投入太多的精力,因为我看了很多网上教程,不动设置哪一种,基本上都可以得到一个比较好的结果,按系统的默认设置即可。

放大算法选项

3. 实操效果

2倍放大

看整体,放大后的图像,猫脖子处毛发有明显变化。

看局部,放大后的图片,猫脸细节纹理明显更加细腻:

3倍放大

看整体:3倍放大后,图像有一些明显的变异,猫鼻子、耳朵、眼睛变红,整体脸型变得突出。

看细节:大图上,猫眼的细节神态非常清晰,炯炯有神。

4倍放大

计算资源受限,GPU爆显存:

报错的含义是:OutOfMemoryError:CUDA内存不足。尝试分配4.00 GiB(GPU 0;总容量15.74 GiB;已分配10.21 GiB;剩余3.91 GiB;PyTorch总共保留了10.22 GiB)如果保留的内存远大于分配的内存,请尝试设置max_split_size_mb以避免碎片化。

工作流小结

爆显存的例子可以看出,AI绘图对计算资源消耗很大,即使硬件可以承担,更大的画面要求也意味着更长等待时间。

比较高效的工作流思路是:

第一步:用小图快速迭代

先用小图(512x512)开始绘制,快速迭代多个版本,在生成的系列图中,找到画面布置符合要求的。这是一个海选的过程。

设置批次数量,可以一次生成大量的底图,供筛选:4x4,就是一次输出16个效果。

第二步:放大生成高清

写在最后

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除
### Stable Diffusion在工业设计中的应用案例与场景 Stable Diffusion作为一种基于扩散模型的生成技术,在图像合成、风格迁移以及创意设计领域展现出了强大的能力。其核心在于通过学习数据分布来生成高质量的内容,这使得它能够被广泛应用于工业设计的不同环节。 #### 工业设计中的具体应用场景 1. **产品外观设计** 设计师可以利用Stable Diffusion快速生成多种产品的外观设计方案。例如,输入特定的产品类别(如手机壳或家具),并结合所需的材质纹理和颜色偏好,即可自动生成多个备选方案[^1]。这种方法显著减少了传统手工绘制草图的时间成本。 2. **品牌视觉识别系统 (VI) 创作** 对于企业品牌形象的设计工作来说,创建统一而有吸引力的视觉元素至关重要。借助该工具,可以根据既定的品牌调性和关键词自动生产一系列符合标准的颜色搭配、字体样式及图案装饰建议[^3]。 3. **概念艺术开发** 在新产品研发初期阶段,往往需要大量探索性的构思表达形式。此时运用此类AI算法可以帮助团队更高效地捕捉灵感火花,并将其转化为可视化的初步形态供进一步讨论完善之用[^2]。 4. **交互界面(UI)/用户体验(UX)优化** 当涉及到软件平台或者硬件设备的人机互动部分时,则可以通过模拟不同情境下的用户行为模式来进行针对性调整改进;同时也能辅助完成图标按钮等细节部位的艺术处理过程。 5. **虚拟现实(VR) 和增强现实(AR) 资产制作** 随着元宇宙概念日益火热起来之后,越来越多的企业开始涉足这一新兴市场当中去寻找商机所在之处——而这其中不可或缺的一部分就是构建逼真的三维环境模型及其内部物件配置情况等等相关内容素材库建设方面的工作量巨大无比繁重不堪难以承受得住压力啊朋友们!!但是有了这项黑科技加持以后呢?我们就可以轻松搞定啦哈哈哈😄😊😎😏😜😝! ```python from diffusers import StableDiffusionPipeline import torch model_id = "runwayml/stable-diffusion-v1-5" pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16).to("cuda") prompt = "A modern chair with sleek lines and metallic finish suitable for office environments." image = pipe(prompt).images[0] image.save("./modern_office_chair.png") ``` 上述代码片段展示了如何使用Hugging Face提供的`diffusers`库加载预训练好的Stable Diffusion模型,并指定提示词生成一张现代办公椅样式的图片文件保存到本地磁盘上以便后续查看编辑修改用途所用。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值