马尔科夫过程详解

最新推荐文章于 2025-11-06 11:29:22 发布

原创最新推荐文章于 2025-11-06 11:29:22 发布 · 7.7k 阅读

13 ·

CC 4.0 BY-SA版权

神经网络专栏收录该内容

5 篇文章

订阅专栏

本文详细探讨了马尔科夫链的平稳分布，包括记号说明、马氏性、定理一（平稳分布的存在性）以及定理二（细致平稳条件）。通过社会经济阶层转移的实例，展示马氏链如何随着时间推移达到稳定分布，说明阶级固化现象。此外，还证明了平稳分布与初始概率分布无关，主要由概率转移矩阵决定。

马尔科夫链随机过程之所以如此重要，在于其平稳分布（stationary distribution），也即对它而言，它存在一个平稳分布。

1. 记号的说明

q(i,j)==q(j|i)==q(i→j)
表示一个转移矩阵为 Q的马氏链，从状态 i转移到状态 j的概率

2. 马氏性

Xn 标识时刻 n 的状态，关于马氏性的数学表达为：

P (X n + 1 = k | X n = k n, X n - 1 = k n - 1, \dots, X 1 = k 1) = P (X n + 1 = k | X n = k n)

也就是状态转移的概率只依赖与

3. 定理一

如果一个非周期马氏链具有概率转移矩阵 P，且它的任何两个状态都是连通的，则 limn→∞Pnij 存在且与 i 无关（也即矩阵 Pn 的每一行元素都相同），记 limn→∞Pnij=π(j)，我们有：

lim n \to \infty P n = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ π (1) π (1) \dots π (1) \dots π (2) π (2) \dots π (2) \dots \dots \dots \dots \dots \dots π (j) π (j) \dots π (j) \dots \dots \dots \dots \dots \dots ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

π (j) = \sum i = 0 \infty π (i) P i j

也即

π = π P

π 是方程 π=πP 的唯一非负解
其中，π=[π(1),π(2),⋯,π(j),⋯]，∑i=0nπ(i)=1（符合概率上对分布的要求），π 称为马氏链的平稳分布。

马氏链的任何两个状态是连通的含义是指存在一个 n，使得矩阵 Pn 的任何一个元素的数值都大于0.
两个状态 i,j 连通并非是指 i 可以直接一步转移到 j （Pij>0），而是指 i 可以通过有限的 n 步转移到达 j（Pnij>0）
我们用 Xi 表示马氏链上跳转第 i 步后所处的状态，如果 limn→∞Pnij=π(j)存在，我们试着来证明上述结论的第二个结论：

P (X n + 1 = j) = = \sum i = 0 \infty P (X n = i) P (X n + 1 = j | X n = i) \sum i = 0 \infty P (X n = i) P i j

上式两边取极限就得到：π(j)=∑i=0∞π(i)Pij

平稳分布的考察

我们先来看马氏链的一个具体的例子。社会学家经常把人按其经济状况分成三类：下层（lower-class）、中层（middle-class）、上层（upper-class），我们用1,2,3分别代表这三个阶层（对应于马氏链中环境下的三个状态）。如下图所示：

社会学家们统计研究发现，决定一个收入阶层的最为重要的因素是就是其父母的收入阶层。如果一个人的收入属于下层类别，那么他的孩子属于下层收入的概率是0.65，属于中层收入的概率是0.28，属于上层收入的概率是0.07，如上图（标识状态转移矩阵）的第一行所示。使用矩阵的表示方式，转移概率矩阵为：

P = ⎡ ⎣ ⎢ 0.65 0.15 0.12 0.28 0.67 0.36 0.07 0.18 0.52 ⎤ ⎦ ⎥

假设当前这一代人处在下层、中层、上层的人的比例是概率分布向量

π0=[π0(1),π0(2),π0(3)]，则他们的子女的分布比例将是

π1=π0P，他们的孙子代的分布比例将是

π2=π1P=π0P2，第

n代子孙的收入比例将是

πn=π0Pn。
假设初始概率分布为

π0=[0.21,0.68,0.11]，我们可以使用如下的python程序，计算前

n代人的分布状况：

import numpy as np
pi_0 = np.array([.21 ,.68, .11])
P = np.array([[.65, .28, .07],
              [.15, .67, .18],
              [.12, .36, .52]])
x = pi_0
pi_n = [x]
for i in range(11):
    print('{:.3f} {:.3f} {:.3f}'.format(x[0], x[1], x[2]))
    x = np.dot(x, P)
    pi_n.append(x)1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11

运行的结果如下：

 0: 0.210 0.680 0.110
 1: 0.252 0.554 0.194
 2: 0.270 0.512 0.218
 3: 0.278 0.497 0.225
 4: 0.282 0.492 0.226
 5: 0.284 0.490 0.226
 6: 0.285 0.489 0.225
 7: 0.286 0.489 0.225
 8: 0.286 0.489 0.225
 9: 0.286 0.489 0.225
10: 0.286 0.489 0.225
11: 0.286 0.489 0.225
12: 0.286 0.489 0.2251
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13

我们发现从7代人开始，这个分布就稳定不变了，等等，这背后的意义是什么，是阶级固化呀，数学能不fascinating吗。

再来验证 πP=π，

print(pi_n[-1])
            # [ 0.28658731  0.48848854  0.22492415]
print(np.dot(pi_n[-1], P))
            # [ 0.28654593  0.48850446  0.22494961]1
2
3
4
1
2
3
4

接着我们问，这是偶然的吗，也即跟初始分布密切相关的吗？我们换一个初始概率分布 π0=[0.75,0.15,0.1]试试看，继续计算前 n代人的分布状况如下：

 0: 0.750 0.150 0.100
 1: 0.522 0.346 0.132
 2: 0.407 0.426 0.167
 3: 0.349 0.459 0.192
 4: 0.318 0.475 0.207
 5: 0.303 0.482 0.215
 6: 0.295 0.485 0.220
 7: 0.291 0.487 0.222
 8: 0.289 0.488 0.224
 9: 0.288 0.488 0.224
10: 0.287 0.488 0.225
11: 0.287 0.488 0.225
12: 0.287 0.488 0.225
....     1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14

从第10代开始也达到令人发指的平稳。更为神奇的是，两者给定的不不同初始概率分布，最终都收敛到概率分布 π=[0.286,0.489,0.225]，也即收敛的行为和初始概率分布 π0无关，收敛行为主要是由概率转移矩阵 P决定的。我们不妨计算一下 Pn（这里的 Pn仍表示矩阵乘法，而非按位相乘）：

t = P
for i in range(100):
    if i > 18:
        print(t)
    t = np.dot(t, P)1
2
3
4
5
1
2
3
4
5

输出为：

[[ 0.28650174  0.48852144  0.22497682]
 [ 0.28650126  0.48852163  0.22497712]
 [ 0.28650118  0.48852166  0.22497717]]
[[ 0.28650156  0.48852151  0.22497693]
 [ 0.28650132  0.4885216   0.22497708]
 [ 0.28650127  0.48852162  0.22497711]]
[[ 0.28650147  0.48852154  0.22497698]
 [ 0.28650135  0.48852159  0.22497706]
 [ 0.28650132  0.4885216   0.22497708]]
[[ 0.28650143  0.48852156  0.22497701]
 [ 0.28650136  0.48852159  0.22497705]
 [ 0.28650135  0.48852159  0.22497706]]

...1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14

我们发现，当 n足够大的时候，这个 Pn矩阵的每一行都是稳定地收敛到 π=[0.286,0.489,0.225]这个概率分布。自然地，这个收敛现象并非是某一个马氏链所独有的，而是绝大多数马氏链的共同行为。

定理二（细致平稳条件，detailed balance condition）

如果非周期马氏链的转移矩阵 P和分布 π(x)满足：

π (x) P i j = π (j) P j i

则

π(x)是马氏链的平稳分布，上式被称为细致平稳条件（detailed balance condition）。

证明：
由细致平稳条件的定义可知：

\sum i = 0 \infty π (i) P i j = \sum i = 0 \infty π (j) P j i = π (j) \sum i = 0 \infty P j i = π (j) \Rightarrow π P = π

故

是平稳分布

。

下面是马尔科夫术语说明：

1. irreducible: 是指链从状态空间里一个位置经过有限步跳转到任何一个位置的概率大于0， 即说的是 马氏链里任何两个状态都是互通的（communicate）！

2. reducible: 即可约的，意思就是在状态集中至少存在一个 状态i到状态j是不通的！（注意有可能j到i是通的）

3. aperiodic: 如果 链从所有任意起点返回到自己所需要的 步数集 的最大公约数为1，则说明此链是非周期的，即所有状态不是定期返回的 且所有返回的间隔的最大公约数为1，即基本找不到规律！

%某状态是非周期的充要条件：1.此状态带有自环，即可以一步跳转到自己。 或者 2.此状态与一个非周期状态互通。

4. communicate: 如果马尔可夫链里 某状态i经过n步到达状态j的概率>0且 相反的，状态j经过n步到i的概率也>0，即说明这俩状态是互通的. 如果对所有n上面都不成立，则证明i，j不通。

5. ergodic：马氏链的一个状态j是非周期&正常返（从它出发，对所有n步跳转 的 第一次返回到它的可能性的和=1），说明此状态j为遍历的，一个不可约的马氏链所有状态为遍历的则说明此马氏链就是遍历链！

%ergodic链=irreducible链

%遍历链=存在平稳分布&&平稳分布与初始分布无关&&平稳分布唯一

%转移矩阵的所有元素是正的马尔可夫链 肯定是 是非周期和不可约的！

6. 规则链regular chain定义为：如果链的 转移矩阵的 某个幂 只包含 >0的元素！

%所以ergodic的链不一定是regular的！即比如自己不能一步转到自己的链，比如1只能跳到到2，2只能跳到1的情况，此时1到1的概率是0，2到2的概率也是0

（所以区别于规则链: 对于ergodic即不可约链里的ij，不同ij互通所需的跳转步数可能是不同的。而规则链意思就是肯定存在一个统一的步数，在此时所有状态完全互通）

7. reversible markov chain可逆的马尔可夫链： 对于有限状态的马尔可夫链 T，如果存在 一个唯一的 分布p，使得 对该链状态空间里的任意一对 状态a，b满足：

  从a跳转到b的概率就等于从b跳转到a的概率,则称此链 可逆。

 此 条件形成的 等式就叫做细致均衡条件detailed balance.