5、哈密顿蒙特卡罗方法与Stan实践

哈密顿蒙特卡罗方法与Stan实践

1. 哈密顿蒙特卡罗方法概述

在相关应用中,哈密顿蒙特卡罗方法(HMC)被广泛采用,它取代了Metropolis - Hastings方法。在马尔可夫链的情境下,像$\sigma \leftarrow N(\sigma, 0.5^2)$这样的更新被称为随机游走。而HMC通过应用哈密顿方程(一种类似牛顿运动方程的方程),不依赖随机游走,就能在保持低拒绝率的同时显著改变状态。

设$\theta(t) = [\theta_1(t), \ldots, \theta_d(t)]^{\top}$和$p(t) = [p_1(t), \ldots, p_d(t)]^{\top}$分别为$d$个粒子在时间$t$的位置和动量(质量与速度的乘积)。动能$V(p)$和势能$U(\theta)$的总和$H(p, \theta) = V(p) + U(\theta)$被称为哈密顿量。并且有哈密顿方程:
$\frac{d\theta(t)}{dt} = \nabla_pV(p)$
$\frac{dp(t)}{dt} = -\nabla_{\theta}U(\theta)$

一般地,如果$u = \varphi(t)$,$v = \psi(t)$可微,且$f(u, v)$关于$u$,$v$可全微分,复合函数$w = f(u, v) = f(\varphi(t), \psi(t))$的导数可表示为$\frac{dw}{dt} = \frac{\partial f}{\partial u}\frac{du}{dt} + \frac{\partial f}{\partial v}\frac{dv}{dt}$。利用此式可证明能量守恒定律$\frac{dH(p, \t

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值