35、半马尔可夫过程的定时比较与维特比训练中的平局处理

半马尔可夫过程的定时比较与维特比训练中的平局处理

半马尔可夫过程的定时比较

在半马尔可夫过程的研究中,我们引入了一些关键的符号和概念来进行定时比较。
- 符号定义 :固定一个半马尔可夫过程 $M$,设 $C_M = Convex({\rho(s) | s \in S})$,对于 $n \in \mathbb{N}$,定义定时分布 $F_{M,n}$ 如下:当 $n = 0$ 时,$F_{M,n}(t) = 1$;否则,$F_{M,n}(t) = \sup {(\mu_1 * \cdots * \mu_n)(t) | \mu_1, \ldots, \mu_n \in C_M}$。
- 引理 14 :对于所有的状态 $s$ 和所有的输出序列 $w$,有 $I_{P_M}(s, w) \leq F_{M,|w|}$。
- 定理 15 :对于一个常数 $\varepsilon > 0$,存在一个算法,给定一个具有缓慢且有效定时分布的半马尔可夫过程 $M$、两个状态 $s$ 和 $s’$ 以及一个时间界限 $b \in \mathbb{R} {\geq 0}$,该算法可以确定是否对于所有的输出序列 $w$ 和所有 $t \leq b$,都有 $I {P_M}(s, w, t) \geq I_{P_M}(s’, w, t) - \varepsilon$。

下面是该算法的证明思路:
1. 由于 $S$ 是有限的,存在一个可计算的函数 $\varepsilon : \mathbb{N} \times \mathbb{R} {\

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值