29、马尔可夫链蒙特卡罗方法与受限玻尔兹曼机

马尔可夫链蒙特卡罗方法与受限玻尔兹曼机

1. 马尔可夫链蒙特卡罗方法基础

1.1 详细平衡与马尔可夫链

在可能状态空间无限的情况下,详细平衡这种形式在数学上较为便利,因此被广泛应用于马尔可夫链蒙特卡罗(MCMC)方法中,用于基于当前点来采样下一个点。简单来说,马尔可夫链的运动期望表现得像处于稳态的气体分子,在高概率区域停留的时间比在低概率区域长,同时保持详细平衡条件不变。

1.2 马尔可夫链的条件

为了良好地实现马尔可夫链,还需要满足以下几个条件:
- 不可约性 :马尔可夫链的一个理想特性是能够从一个状态到达任何其他状态。这很重要,因为在马尔可夫链中,虽然我们希望以高概率不断探索给定状态的附近状态,但有时可能需要进行跳跃,探索一些较远的邻域,期望新区域可能是另一个高概率区域。
- 非周期性 :马尔可夫链不应过于频繁地重复,否则将无法遍历整个空间。例如,想象一个有 20 个状态的空间,如果在探索了 5 个状态后链就重复,那么就不可能遍历所有 20 个状态,从而导致采样效果不佳。

2. 梅特罗波利斯算法

2.1 算法原理

梅特罗波利斯算法是一种马尔可夫链蒙特卡罗方法,它使用当前接受的状态来确定下一个状态。时间 $(t + 1)$ 的样本条件依赖于时间 $t$ 的样本。时间 $(t + 1)$ 提出的状态是从一个均值等于时间 $t$ 的当前样本且具有指定方差的正态分布中抽取的。抽取后,会检查时间 $(t + 1)$ 和时间 $t$ 的样本之间的概率比。如果 $\frac{P(x^{(t + 1)}

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值