DDPM中如何理解“L_simple在 t = 1 时近似 L_0 ” ？

最新推荐文章于 2025-12-02 15:55:42 发布

原创

最新推荐文章于 2025-12-02 15:55:42 发布 · 634 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#概率论 #人工智能

如何理解“ $LsimpleL_{\text{simple}}$ 在 $t = 1$ 时近似 $L_0$ ” ？

这是一个非常微妙但关键的点。我们来彻底讲清楚 “ $LsimpleL_{\text{simple}}$ 在 $t = 1$ 时近似 $L_0$ ” 这句话背后的含义，以及什么是“关联”。

1. 回顾 $L_0$ 项（精确的方法）

首先，我们明确 $L_0$ 是什么：
$L0=−log⁡pθ(x0∣x1)L_0 = -\log p_\theta(x_0 | x_1)$
其中 $pθ(x0∣x1)p_\theta(x_0 | x_1)$ 是通过那个离散解码器计算出来的：
$pθ(x0∣x1)=∏i=1D∫δ−(x0i)δ+(x0i)N(x;μθi(x1,1),σ12)dxp_\theta(x_0|x_1) =\prod_{i=1}^D \int_{\delta_{-}(x_0^i)}^{\delta_{+}(x_0^i)} \mathcal{N}(x; \mu_\theta^i(x_1, 1), \sigma_1^2) dx$