6、连续时间马尔可夫过程的近似推断

连续时间马尔可夫过程的近似推断

1. 引言

马尔可夫过程是用于描述具有顺序结构数据的概率模型,常见于动力学系统中,系统状态随时间演变。在实际建模时,通常假设系统状态不可直接观测,每次观测都是对潜在隐藏状态的不完全、非线性且含噪声的测量。一般来说,系统观测仅在离散时间点进行,而底层系统本质上是连续时间的。连续时间马尔可夫过程在物理、环境建模、金融、工程和系统生物学等多个科学领域都有应用。

系统的连续时间演化对模型动力学施加了强约束。例如,扩散过程的单个轨迹是粗糙的,但平均轨迹是时间的平滑函数。然而,在设计实际系统时,这些信息往往未被充分利用。主要原因是推断状态轨迹和模型参数是一个难题,因为轨迹是无限维对象,所以实际方法通常需要某种近似。常见的近似方法包括:
- 马尔可夫链蒙特卡罗(MCMC)方法 :通常对时间进行离散化。
- 粒子滤波 :用有限数量的点质量近似连续密度。
- 完美模拟方法 :近年来被提出,其优势在于不需要使用时间离散化来近似转移密度。
- 扩展卡尔曼滤波/平滑器和矩闭合方法 :基于高斯假设,用有限的矩来表示状态变量的统计信息。

本文将讨论一种有前景的变分方法,用于解决连续时间马尔可夫过程的推断问题。我们将重点关注扩散过程,其中系统状态是一个连续变量,受确定性强迫(漂移)和随机噪声过程(扩散)的影响。不过,该方法也可应用于其他过程,如马尔可夫跳跃过程(MJPs)。对于扩散过程,该方法基于高斯近似,但与完美模拟MCMC一样,不基于转移密度的离散时间近似。

2.
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值