高效维特比算法与非平稳语音声学对象解析
高效维特比算法
在语音识别领域,维特比算法是一种常用的动态规划算法,用于在隐马尔可夫模型(HMM)中寻找最可能的状态序列。下面将介绍几种专门为基于词法树的有限状态自动机(FSA)和HMM声学模型设计的维特比算法。
维特比 - M(Viterbi - M)算法
该算法主要用于处理词法树模型与扩展声学HMM模型。具体步骤如下:
1. 对于队列 aux child 中的每个活跃状态 (i′, s′) ,将其提取出来。
2. 更新分数: s′ ← s′ · emission[e index[i′]] 。
3. 将 (i′, s′) 放入队列 α(t + 1) 中。
4. 更新最佳概率: best prob ← max(best prob, s′) 。
5. 丢弃 α(t) 中分数低于束阈值(beam threshold)的活跃状态。
该算法的时间复杂度与活跃状态的数量以及活跃状态的子状态数量呈线性关系。其主要优势在于使用连续内存的先进先出(FIFO)队列来存储活跃状态,相比使用链表或哈希表的算法,具有更好的缓存性能和更低的内部循环开销,从而在实际应用中实现了速度提升。
跨词上下文相关单元扩展
由于该算法用于具有扩展声学HMM模型的词法树模型,因此对于词内上下文建模,使用上下文相关单元非常直接。对于跨词模型,考虑到在连续语音识别中,单词开头的上
超级会员免费看
订阅专栏 解锁全文
743

被折叠的 条评论
为什么被折叠?



