6、连续时间马尔可夫过程的近似推断-优快云博客

连续时间马尔可夫过程的近似推断

1. 引言

马尔可夫过程是用于描述具有顺序结构数据的概率模型，常见于动力学系统中，系统状态随时间演变。在实际建模时，通常假设系统状态不可直接观测，每次观测都是对潜在隐藏状态的不完全、非线性且含噪声的测量。一般来说，系统观测仅在离散时间点进行，而底层系统本质上是连续时间的。连续时间马尔可夫过程在物理、环境建模、金融、工程和系统生物学等多个科学领域都有应用。

系统的连续时间演化对模型动力学施加了强约束。例如，扩散过程的单个轨迹是粗糙的，但平均轨迹是时间的平滑函数。然而，在设计实际系统时，这些信息往往未被充分利用。主要原因是推断状态轨迹和模型参数是一个难题，因为轨迹是无限维对象，所以实际方法通常需要某种近似。常见的近似方法包括：
- 马尔可夫链蒙特卡罗（MCMC）方法 ：通常对时间进行离散化。
- 粒子滤波 ：用有限数量的点质量近似连续密度。
- 完美模拟方法 ：近年来被提出，其优势在于不需要使用时间离散化来近似转移密度。
- 扩展卡尔曼滤波/平滑器和矩闭合方法 ：基于高斯假设，用有限的矩来表示状态变量的统计信息。

本文将讨论一种有前景的变分方法，用于解决连续时间马尔可夫过程的推断问题。我们将重点关注扩散过程，其中系统状态是一个连续变量，受确定性强迫（漂移）和随机噪声过程（扩散）的影响。不过，该方法也可应用于其他过程，如马尔可夫跳跃过程（MJPs）。对于扩散过程，该方法基于高斯近似，但与完美模拟MCMC一样，不基于转移密度的离散时间近似。