隐半马尔可夫模型中前向-后向公式的推导
1. 引言
隐半马尔可夫模型(HSMM)是一种强大的统计工具,广泛应用于语音识别、活动识别、网络流量特征化等多个领域。HSMM的关键在于其能够处理状态持续时间的分布,并且在状态期间产生的观测值数量相关。为了有效地利用HSMM,理解并掌握其核心算法——前向-后向公式是至关重要的。
前向-后向公式是HSMM的基础算法之一,主要用于评估部分观测序列的联合概率,以及计算预测、过滤和平滑概率等关键任务。本文将详细介绍前向-后向公式的数学推导过程,帮助读者深入理解HSMM的推理算法。
2. 前向变量和后向变量的定义
2.1 前向变量
前向变量 (\alpha_t(j, d)) 定义为在给定模型参数 (\lambda) 的情况下,从初始时刻到时刻 (t) 的部分观测序列 (o_1:t) 和状态 (S[t-d+1:t]) 为 (j) 的联合概率:
[
\alpha_t(j, d) = P[S[t-d+1:t] = j, o_1:t | \lambda]
]
2.2 后向变量
后向变量 (\beta_t(j, d)) 定义为在给定模型参数 (\lambda) 的情况下,从时刻 (t) 到结束时刻 (T) 的部分观测序列 (o_{t+1:T}) 和状态 (S[t-d+1:t]) 为 (j) 的条件概率:
[
\beta_t(j, d) = P[o_{t+1:T} | S[t-d+1:t] = j, \lambda]
]