哈密顿蒙特卡罗方法与Stan实践
1. 哈密顿蒙特卡罗方法概述
在相关应用中,哈密顿蒙特卡罗方法(HMC)被广泛采用,它取代了Metropolis - Hastings方法。在马尔可夫链的情境下,像$\sigma \leftarrow N(\sigma, 0.5^2)$这样的更新被称为随机游走。而HMC通过应用哈密顿方程(一种类似牛顿运动方程的方程),不依赖随机游走,就能在保持低拒绝率的同时显著改变状态。
设$\theta(t) = [\theta_1(t), \ldots, \theta_d(t)]^{\top}$和$p(t) = [p_1(t), \ldots, p_d(t)]^{\top}$分别为$d$个粒子在时间$t$的位置和动量(质量与速度的乘积)。动能$V(p)$和势能$U(\theta)$的总和$H(p, \theta) = V(p) + U(\theta)$被称为哈密顿量。并且有哈密顿方程:
$\frac{d\theta(t)}{dt} = \nabla_pV(p)$
$\frac{dp(t)}{dt} = -\nabla_{\theta}U(\theta)$
一般地,如果$u = \varphi(t)$,$v = \psi(t)$可微,且$f(u, v)$关于$u$,$v$可全微分,复合函数$w = f(u, v) = f(\varphi(t), \psi(t))$的导数可表示为$\frac{dw}{dt} = \frac{\partial f}{\partial u}\frac{du}{dt} + \frac{\partial f}{\partial v}\frac{dv}{dt}$。利用此式可证明能量守恒定律$\frac{dH(p, \t
超级会员免费看
订阅专栏 解锁全文
1333

被折叠的 条评论
为什么被折叠?



