人工智能_大模型066_多模态大语言模型14_Stable Diffusion Model_SDM扩散模型_迭代情况_开源SD模型部署_SDWEBUI_COMFUI搭建---人工智能工作笔记0201

本文介绍了Stable Diffusion Model(SDM),一种优化过的图像生成模型,通过降低计算成本和在隐变量空间进行扩散操作实现图像控制。重点讲述了SDM在VAE压缩和Latent Space的扩散过程中的改进,并提及了语义图在模型中的应用。此外,文章讨论了开源SD模型如SD-WEBUI和COMFYUI的部署,以及它们在模型管理和定制上的便利性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一节说的DIT模型,由于预测出来的图像,不可控,所以没有实用价值,所以这里又

出现了Stable Diffusion Model模型,稳定扩散模型.

可以就有了这样一个模型,就可以实现对输出图像的控制,可以看到

SDM模型,主要做了两方面的优化

1.首先降低计算成本,把图片使用VAE,抽取隐变量层的方式,将图像进行压缩,用压缩后的隐变量进行计算,可以将原来的大小压缩到

原尺寸的1/4,这样,还原过来几乎是无损的,因为之前的的VAE压缩的太严重了,所以才会有,有损的现象.

2.然后在Latent Space这个层中进行,diffusion扩散加噪声,和,进行去噪声

3.而且这个过程,可以看到,可以在UNet,去噪声的过程中,给模型,添加参考的images,图片 或者文本 或者semantic map

“semantic map”在计算机科学、人工智能、语言学和认知科学中通常指的是语义图语义映射

  1. 语义图(Semantic Graph):这是一种数据结构,用于表示实体(如概念、对象或事件)之间的关系。在知识表示中,语义图可以用来捕捉和表示复杂的知识结构,包括实体间的层次关系、属性、事件等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值