这张图片展示了两个算法,分别是用于训练和采样的。以下是这两个算法的解释:
算法1:训练
这个算法描述了如何训练模型参数 θ \theta θ。
- repeat: 训练过程是一个迭代的过程,重复以下步骤直到收敛。
- x 0 ∼ q ( x 0 ) x_0 \sim q(x_0) x0∼q(x0): 从数据分布 q ( x 0 ) q(x_0) q(x0)中采样一个样本 x 0 x_0 x0。
- t ∼ Uniform ( { 1 , … , T } ) t \sim \text{Uniform}(\{1, \ldots, T\}) t∼Uniform({ 1,…,T}): 从均匀分布 { 1 , … , T } \{1, \ldots, T\} { 1,…,T}中随机选择一个时间步 t t t。
- ϵ ∼ N ( 0 , I ) \epsilon \sim \mathcal{N}(0, I) ϵ∼N(