稳定扩散(Stable Diffusion)算法是当前文生图领域最主流的技术之一。本文深入剖析其核心原理,包括前向扩散逐步添加噪声、逆向扩散逐步去除噪声,以及在潜在空间进行操作以提高效率等关键要点。同时,结合丰富的实践案例,详细讲解如何利用该算法实现从文本到高质量图像的生成过程,帮助读者全面掌握这一前沿技术,开启创意无限的文生图之旅!
前向过程:
后向生成过程:
diffusion算法作为目前文生图最主流的算法,目前应用如火如荼。之前做文本算法比较多,个人因为早前作为图像处理和模式识别,所以也还算上手比较快,其实这个diffusion算法和模式识别的图像算法没啥太大关系,就是一个概率论和数理统计的事情。
前向过程(forward):用高斯分布噪声不断添加到图像中,当添加N次后(N是一个相当大的数),那么图像会趋向接近于一个高斯分布(极限定理,很好理解)。
后向过程(Generative Process):给一张高斯噪声图,通过给定文本提示,生成相应的图,这个就是前向的反向过程,数学推导过程,建议用贝叶斯来推,会相对好理解一些,公式比较复杂就不写了,有兴趣的读者自己去翻相关paper论文吧。
有时间的话,我会结合算法原理和代码实践,来说明一下上述过程是怎么发生的。
这份完整版的SD全套资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】