LLM大模型中的基础数学工具——随机过程与采样

Q17: 分析马尔可夫链的平稳分布存在条件(Perron - Frobenius 定理应用)

马尔可夫链平稳分布是啥?

马尔可夫链的平稳分布是一个概率分布\pi,满足 \pi P = \pi,其中 P 是转移矩阵。简单说,就是经过多次状态转移后,分布不再变化。比如天气变化的马尔可夫链,平稳分布表示长期的天气概率。

Perron - Frobenius 定理怎么用?

Perron - Frobenius 定理指出,正矩阵(元素全正)有唯一的正特征向量(对应最大特征值)。对马尔可夫链,若转移矩阵 P 不可约(所有状态相通)且非周期(无固定循环周期),则 P 满足定理条件。此时,存在唯一的平稳分布\pi,且\pi所有元素为正。

在 LLM 中的使用

在 LLM 的文本生成中,可将词的生成视为马尔可夫链。例如,基于前一个词生成下一个词的转移矩阵,若满足不可约非周期,平稳分布可表示文本中词的长期概率分布,帮助模型生成更自然的文本。

代码示例(模拟简单马尔可夫链)

import numpy as np  
# 定义不可约非周期的转移矩阵  
P = np.array([[0.7, 0.3], [0.4, 0.6]])  
# 计算平稳分布(解πP = π,归一化)  
vals, vecs = np.linalg.eig(P.T)  
pi = vecs[:, np.argmax(np.abs(vals))].real  
pi /= pi.sum()  
print("平稳分布:", pi)  

解释:通过特征值分解求平稳分布,验证了定理在简单马尔可夫链中的应用。LLM 中类似思路可分析词生成的长期分布。


Q18: 推导 Metropolis - Hastings 采样中的接受概率 A(x'|x)

Metropolis - Hastings 采样是啥?

这是一种从目标分布 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

墨顿

唵嘛呢叭咪吽

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值