半马尔可夫过程的定时比较与维特比训练中的平局处理
半马尔可夫过程的定时比较
在半马尔可夫过程的研究中,我们引入了一些关键的符号和概念来进行定时比较。
- 符号定义 :固定一个半马尔可夫过程 $M$,设 $C_M = Convex({\rho(s) | s \in S})$,对于 $n \in \mathbb{N}$,定义定时分布 $F_{M,n}$ 如下:当 $n = 0$ 时,$F_{M,n}(t) = 1$;否则,$F_{M,n}(t) = \sup {(\mu_1 * \cdots * \mu_n)(t) | \mu_1, \ldots, \mu_n \in C_M}$。
- 引理 14 :对于所有的状态 $s$ 和所有的输出序列 $w$,有 $I_{P_M}(s, w) \leq F_{M,|w|}$。
- 定理 15 :对于一个常数 $\varepsilon > 0$,存在一个算法,给定一个具有缓慢且有效定时分布的半马尔可夫过程 $M$、两个状态 $s$ 和 $s’$ 以及一个时间界限 $b \in \mathbb{R} {\geq 0}$,该算法可以确定是否对于所有的输出序列 $w$ 和所有 $t \leq b$,都有 $I {P_M}(s, w, t) \geq I_{P_M}(s’, w, t) - \varepsilon$。
下面是该算法的证明思路:
1. 由于 $S$ 是有限的,存在一个可计算的函数 $\varepsilon : \mathbb{N} \times \mathbb{R} {\