14、基于扩散模型的舞蹈生成快速采样方法

基于扩散模型的舞蹈生成快速采样方法

1. 去噪扩散概率模型基础

去噪扩散概率模型(DDPM)利用两个马尔可夫链:前向链将数据扰动为噪声,反向链将噪声转换回数据。给定数据分布 $x_0 \sim q(x_0)$,前向马尔可夫过程通过逐步注入不同 $\sigma$ 的高斯噪声来生成随机变量序列 $x_1, x_2, \cdots, x_T$:
$q(x_t|x_{t - 1}) = N(x_t; \sqrt{1 - \beta_t}x_{t - 1}, \beta_tI)$,
其中 $\beta_t \in (0, 1)$ 是一个随 $t$ 单调递增的常数序列,是预定义的值序列。

在反向马尔可夫过程中,从标准正态分布中获取一个样本,并对其去噪以恢复原始数据分布。样本表示为 $p(x_T) = N(x_T; 0, I)$,去噪操作表示为 $p_{\theta}(x_{t - 1}|x_t)$,形式为:
$p_{\theta}(x_{t - 1}|x_t) = N(x_{t - 1}; \mu_{\theta}(x_t, t), \Sigma_{\theta}(x_t, t))$,
其中 $\theta$ 表示模型参数,均值 $\mu_{\theta}$ 和方差 $\Sigma_{\theta}$ 由深度神经网络参数化。DDPM 的最终训练目标是通过最小化 $q(x_0, x_1, \cdots, x_T)$ 和 $p_{\theta}(x_0, x_1, \cdots, x_T)$ 的 Kullback - Leibler(KL)散度得到:
$L_{simple}(\theta) = E_{t,x_0,\epsilon}[|\epsilon - \epsi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值