Improved Techniques for Training Consistency Models

828 篇文章

已下架不支持订阅

本文介绍了改进的一致性模型训练技术,避免了依赖预训练扩散模型的蒸馏过程,使用伪Huber损失替代LPIPS,并引入对数正态噪声调度。这些改进使得一致性模型在CIFAR-10和ImageNet 64上取得2.51和3.25的FID分数,超越了先前方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Improved Techniques for Training Consistency Models》的翻译。

摘要

一致性模型是一个新生的生成模型家族,它可以在不需要对抗性训练的情况下一步采样高质量的数据。当前的一致性模型通过从预先训练的扩散模型中提取并使用学习的度量(如LPIPS)来实现最佳样本质量。然而,蒸馏将一致性模型的质量限制为预先训练的扩散模型的质量,并且LPIPS在评估中导致不希望的偏差。为了应对这些挑战,我们提出了改进的一致性训练技术,即一致性模型直接从数据中学习,而不进行蒸馏。我们深入研究了一致性训练背后的理论,并发现了一个以前被忽视的缺陷,我们通过从教师一致性模型中消除指数移动平均来解决这个缺陷。为了取代像LPIPS这样的学习指标,我们采用了来自稳健统计的伪Huber损失。此外,我们为一致性训练目标引入了一个对数正态噪声调度,并提出在每一组训练迭代次数下将总离散化步骤增加一倍。结合更好的超参数调整,这些修改使一致性模型能够在单个采样步骤中在CIFAR-10和ImageNet 64上分别获得2.51和3.25的FID分数。与之前的一致性训练方法相比,这些分数分别提高了3.5和4。通过两步采样,我们在这两个数据集上进一步将FID得分降至2.24和2.77,超过了在一步和两步设置中通过蒸馏获得的分数,同时缩小了一致性模型与其他最先进的生成模型之间的差距。

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值