扩散模型:利用非均衡热力学的深度无监督学习
本扩散模型系列内容包含6篇文章,
- 本文是去噪扩散模型的开端;
- 第二篇文章基于本文给出去噪扩散模型;
- 第三篇文章利用SDE将基于分数的概率生成模型和去噪扩散模型统一在一个框架下;
- 第四篇文章给出了第三篇文章的理论证明;
- 第五篇文章将第四篇文章数据的取值空间从 R d \mathbb R^d Rd推广到任意空间。
Deep Unsupervised Learning using Nonequilibrium Thermodynamics
给定数据的概率分布估计问题:机器学习中的一个核心问题是使用概率分布族对复杂的数据集进行建模,
- 要求高度灵活;
- 在这些族中,学习、抽样、推理和评估仍然在分析或计算上是可处理的。
在历史上,概率模型会在两个相互冲突的目标之间进行权衡:可处理性和灵活性
- 易于处理的模型可以进行分析评估,并很容易地拟合数据(例如,高斯分布或拉普拉斯分布),这些模型无法恰当地描述在丰富的数据集中的结构。
- 灵活的模型可以被塑造成适合任意数据中的结构。例如,我们可以用任何(非负的)函数 ϕ ( x ) \phi(\mathbf{x}) ϕ
本文深入探讨了扩散模型,这是一种结合了灵活性和可处理性的深度无监督学习方法。通过非均衡统计物理学的扩散过程,逐步破坏数据分布结构,再学习恢复结构的反向过程,形成强大的生成模型。文章介绍了扩散模型的理论背景、算法细节、在贝叶斯推断中的应用以及实验结果,展示了在图像去噪和修复等方面的潜力。
订阅专栏 解锁全文
1213

被折叠的 条评论
为什么被折叠?



