03:一文搞懂stable diffusion扩散原理,玩转AI绘画

前言

本来想单独写Noise predictor这个U-Net模型的,奈何实力尚浅,觉得还是结合stable diffusion中的diffusion(扩散)的概念一起写,才能更好地理解Noise predictor。

所以,本篇文章主要针对概念性的扩散来写,且本篇文章和我们使用stable diffusion关系不大,只是让大家了解我们在使用stable diffusion时的原理。

扩散(Diffusion)

在stable diffusion的概念中,扩散分为正向扩散(Forward Diffusion)和逆向扩散(Forward diffusion)。下面都以图生图为例,因为一定程度上,文生图可以看成图生图的子集。

正向扩散(Forward Diffusion)

正向扩散,就像一滴墨水掉进了一杯水中,墨水滴在水中扩散,最后墨滴在水中随机分布,你也无法判断墨滴最初是落在杯子中心还是靠近边缘的地方。在stable diffusion中,输入的图片就是杯子,噪声(noise)就是墨滴。

在图生图中,我们要输入一张图片,图片被VAE Encoder解码成一个在Latent Space内的4 * 64 * 64的latent image

Forward Diffusion就是在latent image上,不断添加noise使其变成一个完全随机张量(random tensor),也就是我们说的噪声图。这里,不断添加是关键词,latent image并不是一步就变成了噪声图。

### Stable Diffusion AI 绘画 关键词术语 #### 安装与入门 对于希望进入AI绘画领域的新手而言,获取合适的资源至关重要。Stable Diffusion提供了安装包以及一系列的学习材料,包括但不限于PDF文档视频教程,旨在帮助用户从零基础开始全面掌握这一技术[^1]。 #### 提示词优化 为了更好地控制由Stable Diffusion生成的艺术作品的效果,使用者可以通过精确设置提示词来影响最终成果的质量。例如,在提示词后面加上`[0-1数值]`可以调节该词语在整个描述中的权重;比如,“FOREST, LOTS OF TREES AND STONES,[FLOWERS: 0.7]”。这种做法允许艺术家更加细致地定义他们期望的画面特征[^2]。 #### 正负向提示词的应用 当涉及到具体场景或风格的选择时,合理运用正向(`prompt`)反向(`negative prompt`)提示词显得尤为重要。如果目标是避免某些不理想的输出结果,则可以在负面列表里添加相应的关键词。举例来说,要防止模型误解“cowboy shot”而产生穿着牛仔服饰的角色形象,可在负面提示中加入像“full body”或者“closeup”的选项,从而引导算法避开不必要的细节[^3]。 #### 实际应用案例分析 在实际应用场景方面,《AI 绘画 | Stable Diffusion 电商模特》一文中提到的技术可用于创建虚拟试衣间体验。通过对原始像进行处理并提取服装轮廓作为蒙版,再利用此蒙版将新设计的衣服贴合到人体模型上,进而创造出逼真的展示效果。这种方法不仅提高了工作效率,也为消费者带来了更为直观的商品预览方式[^4]。 ```python # 示例代码用于说明如何加载稳定扩散库(假设存在这样的Python接口) from stable_diffusion import load_model, generate_image_with_prompts model = load_model('path_to_pretrained_weights') image = generate_image_with_prompts( positive_prompt="A beautiful forest with lots of trees and stones", negative_prompt="full body, closeup" ) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值