63、基于粒子的近似推理与马尔可夫链蒙特卡罗方法

基于粒子的近似推理与马尔可夫链蒙特卡罗方法

1. 详细平衡方程与平稳分布

在随机过程中,乘积 $\pi(x)T (x \to x’)$ 代表了这样一个过程:首先根据分布 $\pi$ 随机选取一个起始状态 $x$,然后依据转移模型 $T$ 从该状态进行随机转移到 $x’$。详细平衡方程指出,在这个过程中,从状态 $x$ 转移到 $x’$ 的概率与从 $x’$ 转移到 $x$ 的概率是相等的。

若一个马尔可夫链满足可逆性,这意味着 $\pi$ 是该链转移模型 $T$ 的平稳分布,但并不能保证该链一定会收敛到 $\pi$。不过,如果 $T$ 是正则的,那么收敛就是有保证的,并且可逆性条件为其平稳分布提供了一个简单的特征描述:
- 命题 :如果 $T$ 是正则的,并且相对于 $\pi$ 满足详细平衡方程,那么 $\pi$ 是 $T$ 的唯一平稳分布。

下面通过一个例子来验证这个命题。假设有一个马尔可夫链,对于其中的两个状态 $x_1$ 和 $x_3$,详细平衡方程为 $\pi(x_1)T (x_1 \to x_3) = \pi(x_3)T (x_3 \to x_1)$。已知平稳分布 $\pi$ 满足 $\pi(x_1)=0.2$,$\pi(x_3)=0.3$,且 $T (x_1 \to x_3)=0.75$,$T (x_3 \to x_1)=0.5$,则有 $0.2 \cdot 0.75 = 0.3 \cdot 0.5 = 0.15$,验证了详细平衡方程。

详细平衡方程还可以应用于多个核的情况。如果每个核 $T_i$ 相对于某个平稳分布 $\pi$ 都满足详细平衡方程,那么混合转移模型 $T$ 也满足该方程。对于多步转移

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值