加速diffusion模型训练收敛 Min-SNR Weighting Strategy

Qiming_v

已于 2025-01-02 20:35:39 修改

阅读量597

点赞数 7

分类专栏： Diffusers 文章标签： stable diffusion SNR 训练

于 2025-01-02 17:32:44 首次发布

本文链接：https://blog.youkuaiyun.com/zhilaizhiwang/article/details/144889927

版权

Efficient Diffusion Training via Min-SNR Weighting Strategy
Github，arxiv

信噪比（Signal-to-Noise Ratio, SNR）
高SNR值意味着信号质量好，噪声小；低SNR值则表明信号中噪声成分较多，信号质量差。

DDPM的加噪公式
在这里插入图片描述
论文中用以下公式表示

SNR的计算公式

简化一下就是 $\frac{\bar{\alpha_{t} } }{1-\bar{\alpha_{t} } }$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Qiming_v

关注关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

cvpr2015papers

ZhangPY的专栏

03-02

9233

@http://www-cs-faculty.stanford.edu/people/karpathy/cvpr2015papers/ CVPR 2015 papers (in nicer format than this) maintained by @karpathy NEW: This year I also embedded the (1,2-gram) tfidf

MIMO系统的VBLAST算法仿真

FPGA/MATLAB学习教程/源码/项目合作开发

08-20

7828

第二章 MATLAB简介 Matlab，Matrix Laboratory的简称，是美国Mathworks公司于1984年推出的数值计算机仿真软件，经过不断的发展和完善，如今已成为覆盖多个学科、具有超强数值计算能力和仿真分析能力的软件。Matlab应用较为简单，用大家非常熟悉的数学表达式来表达问题和求解方法。它把计算、图示和编程集成到一个环境中，用起来非常方便。同时，Matlab具有很强的开放性和适应性，在保持内核不变的情况下，Matlab推出了适合不同学科的工具箱，如图像处理工具箱，小波分析工具箱、信号

参与评论您还未登录，请先登录后发表或查看评论

一个生成信噪比（SNR）和噪声方差的函数 noise_gen

weixin_44012667的博客

12-25

373

noise_gen函数用于生成信道信噪比和噪声方差。可以模拟固定噪声环境。如果需要修改为随机信噪比生成，可以启用随机化的代码实现。

改进扩散模型diffusion

whaosoft143ai的博客

01-10

1903

本文强调这种逼近方法的不足，并提出了一种新的引导方法：扩散潜空间的直接优化（Direct Optimization of Diffusion Latents， DOODL），通过优化扩散潜空间相对于预训练分类器在真实生成像素上的梯度，使用可逆扩散过程实现了高效的内存反向传播，实现即插即过的引导。这种方法有两个缺点：（i）监督数据集通常与大规模抓取的文本-图像数据集相比较小，影响生成图像的质量和多样性，或者（ii）输入是一个硬编码标签，而不是自由形式的文本，限制了对生成图像的控制。whaosoft aiot

ICCV 2023 | 从14篇论文看如何改进扩散模型diffusion ？

idol24的博客

01-10

1915

1、Discriminative Class Tokens for Text-to-Image Diffusion Models文本到图像扩散模型，使得生成多样且高质量的图像成为可能。然而，这些图像往往在描绘细节方面不够精细，并且容易出现由于输入文本的歧义导致的错误。缓解这些问题的一种方法是在带类标签的数据集上训练扩散模型。这种方法有两个缺点：（i）监督数据集通常与大规模抓取的文本-图像数据集相比...

Stable Diffusion Lora 在线训练

旭的博客

06-16

1662

本文主要介绍在百度飞桨AI Studio平台部署/运行青龙圣者LORA模型训练包的方法。

每日学术速递3.20

与君共勉，一起学习

03-20

746

标题：ART：大型语言模型的自动多步推理和工具使用作者：Bhargavi Paranjape, Scott Lundberg, Sameer Singh, Hannaneh Hajishirzi, Luke Zettlemoyer, Marco Tulio Ribeiro文章链接：https://arxiv.org/abs/2303.09014摘要：大型语言模型 (LLM) 可以通过生成中间思维链 (CoT) 推理步骤在少镜头和零镜头设置中执行复杂推理。此外，每个推理步骤都可以依赖外部工具来

用python实现经验模态分解+小波软阈值去噪

aweizhenlihai的博客

03-31

1万+

PyEmd模块安装试过很多博主说的pip insyall PyEmd都失败了，偶然间运气好发现正确的安装方式是pip install PyEmd-signal。如果找不到相关的库或者模块，直接去github上去搜索，上面有很详细的安装教程，不要被误导 pywt模块安装 pywt可以实现小波分解与重构，小波阈值降噪，小波包分解等功能，同样安装也是用相应的pip instal pywt来进行安装，如果找不到还是去github上寻找。特别说明关于EMD类方法和小波阈值降噪的相关理论知识可直接百度或

生成式~扩散模型

whaosoft143ai的博客

02-02

1681

001 (2024-02-1) Distilling Conditional Diffusion Models for Offline Reinforcement Learning through Trajectory Stitching https://arxiv.org/pdf/2402.00807.pdf002 (2024-02-1) AnimateLCM Accelerating the Animation of Personalized Diffusion Models and Ad

AIGC绘画：AIGC领域的创意创作新方法

AI 原生应用开发的博客

05-11

605

AIGC（AI-Generated Content，生成式AI内容）正以颠覆性姿态重塑创意产业，其中AIGC绘画作为核心分支，已从实验室走向商业落地。本文聚焦AIGC绘画的技术原理、实现方法与应用场景为何扩散模型成为AIGC绘画的主流技术？文本如何精确控制图像生成？开发者如何快速搭建AIGC绘画应用？技术基础（第2-4章）：解析AIGC绘画的核心概念（扩散模型、CLIP）、算法原理（前向/反向扩散过程）与数学模型（变分下界推导）；工程实践。

cannot import name ‘compute_snr‘ from ‘diffusers.training_utils‘问题解决

ashe152的博客

01-06

269

原因是compute_snr是diffusers新版本中新加的内容，旧版本没有。

WebRTC的噪声抑制（noise suppression，NS）算法

热门推荐

Charles' home

06-24

2万+

WebRTC噪声抑制核心算法在ns_core.c文件里。噪声频谱可以使用如语音/噪声似然函数进行估计。将接收到的每帧信号和频率分量分类为噪声或语音。算法原理该算法的核心思想是采用维纳滤波器抑制估计出来的噪声。上式中x和n分别表示语音和噪声，而y表示麦克风采集到的信号。它们的频谱关系如上，从上图可以看出语音和噪声是加性且不相关的关系，对于非加性关系

Stable Diffusion——使用TensorRT GPU加速提升Stable Diffusion出图速度

知来者逆的博客

02-08

1万+

NVIDIA 已发布了 TensorRT 稳定扩散工作流的演示，为开发者提供了一个参考实例，说明如何准备扩散模型并使用 TensorRT 加速这些模型。如果您有兴趣增强扩散工作流并为您的应用带来快速推理，这将是您的起点。在此基础上，TensorRT 工作流应用于 Stable Diffusion 开发者常用的项目。在 Stable Diffusion Web UI 中实施 TensorRT 进一步普及了生成式 AI，并提供了广泛而轻松的访问。

Stable Diffusion底模对应的VAE推荐

Liudef06的博客

05-23

412

本文提供了主流Stable Diffusion（SD）底模对应的VAE（变分自编码器）推荐表格，帮助用户根据不同的SD版本选择合适的VAE。表格中列出了SD1.5、SD2.0、SD3、SDXL和FLUX等版本的推荐VAE类型，并详细说明了每种版本应使用的具体VAE文件。例如，SD1.5通常使用vae-ft-mse-840000-ema-pruned.safetensors，而SDXL则推荐sdxl_vae.safetensors或官方VAE。此外，文章还指出SD1.5和SDXL的VAE在某些场景下可以交叉兼

Stable Diffusion 简单了解一下

waterHBO的博客

05-26

625

Stable Diffusion = 你的 AI 画师，懂文字，画得好，还能开源跑在家里。“Diffusion” 在英文中的本义是：某种物质从浓度高的地方，逐渐向浓度低的地方蔓延、散开。香水喷在空气中慢慢散开热水中的糖慢慢溶解并扩散到整杯水中它代表的是一个从有序到无序从集中到分散的自然过程。项目含义说明Diffusion 原意从浓到稀，从集中到分散的过程（如气味、热）在 AI 中把图片加噪声 → 模型学会如何从噪声中恢复图像为什么叫扩散模型模型模拟了“扩散 + 去扩散”的数学过程生成过程。

深入理解Diffusers: 从基础到Stable Diffusion

summerriver1的博客

05-22

474

Diffusers的设计理念是让构建扩散系统变得简单直观。构建自己的扩散系统自定义和优化现有Pipeline尝试不同的模型和调度器组合无论你是想构建简单的图像生成系统,还是复杂的文本到图像模型,Diffusers都能为你提供所需的工具和灵活性。

从0到1搭建AI绘画模型：Stable Diffusion微调全流程避坑指南

layneyao的博客

05-26

1004

从0到1搭建AI绘画模型：Stable Diffusion微调全流程避坑指南

多模态AI终极形态？GPT-5与Stable Diffusion 3的融合实验报告

layneyao的博客

05-23

1301

多模态AI终极形态？GPT-5与Stable Diffusion 3的融合实验报告

第五讲电子商务安全.ppt