马尔科夫链(markov chain)

本文介绍了马尔科夫链的基本概念,包括随机过程、下一状态仅依赖当前状态的特性,并通过实例解释了马尔科夫过程。还讨论了转移矩阵的概念及其在马尔科夫链中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

A Markov chain is “a stochastic model describing a sequence of possible events in which the probability of each event depends only on the state attained in the previous event.”

马尔科夫链虽然听上去很高深莫测,但其实它的概念还是很简单的:
1. 随机过程
2. 下一状态只依赖当前状态
举个例子:
一个袋子中有两个红球、一个绿球,不放回的取三次。这种情况下,第二次会受第一取法的影响,第三次会受前两次取法的影响。这是一个随机过程。如果将不放回取改为放回取,那每次取只取决于当前状态而不受之前状态的影响,这就是一个马尔科夫过程。

马尔科夫链是一系列状态之间的转移,对于马尔科夫链来说,一个重要的概念是转移矩阵
这里写图片描述
第i,j元素的意义是当前状态为 jj,下一状态为 i,的概率。这种形式的矩阵每列概率和一定为1。

更常用的是一种转移矩阵是下列形式:
这里写图片描述
Pi,jPi,j表示当前状态为ii, 下一状态为j的概率。这种形式的矩阵成为右随机矩阵(right stochastic matrix)

右随机矩阵的性质:
  • 两个右随机矩阵的乘积仍然是仍然是一个右随机矩阵。
  • 经过N步,状态ii到状态j的概率为(PN)i,j(PN)i,j
  • 初始状态是一个行向量。
  • 平稳概率向量ππ是不随转移矩阵运行而变化的矩阵,也就是说,它是转移矩阵的左特征向量,其特征值为1。
    πP=1πP=1

    并可以观察到对任意 ii 我们都有以下极限而求出,
    limk(Pk)i,j=πj,

    其中 πjπj 是行向量 ππ的第jj 个元素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值