隐马尔科夫模型简介
1、隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测序列的过程。隐藏的马尔科夫链随机生成的状态的序列,称为状态序列;每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列。马尔科夫链由初始概率分布、状态转移概率分布以及观测概率分布确定,其表达式为:
其中,A表示状态转移概率分布,B表示观测概率分布,π表示初始概率分布。
隐马尔可夫模型主要有三大要素,分别是:初始状态向量,状态转移概率矩阵A和观测概率矩阵B。
设从S1到S3,并且输出aab时,从S1出发到S3截止,输出的符号序列是aab,计算概率:
1、S1→S1→S2→S3 0.30.80.51.00.60.5=0.036
2、S1→S2→S2→S3 0.51.00.40.30.60.5=0.018
3、S1→S1→S1→S3 0.30.80.30.80.2*1.0=0.1152
因为不知道该HMM输出aab时是经过了哪一条路径,所以,是把每一种的可能路径概率相加到的总的概率值作为aab的输出概率值。
所以aab的总概率是0.036+0.018+0.1152=0.06552。
2、离散Markov过程
Markov链是Markov 随机过程的特殊情况,即Markov链是状态和时间参数都离散的Markov过程。
设在时刻t的随机变量 的观察值用 表示,则在 的前提下,
的概率是如下式所示,称其为 n 阶 Markov 过程:
HMM的基本元素
M={S,O,A,B,π,F}
S—模型中状态的有限集合,即模型由几个状态组成。
A—状态转移概率的集合。所有转移概率可以构成一个转移概率矩阵,即:
B—输出观测值概率的集合
π—系统初始状态概率的集合。
F—系统终了状态的集合。
这里需要说明的是,严格地说Markov模型是没有终了状态的概念的,只是在语音识别里用的Markov模型要设定终了状态。
简单说明一下HMM是怎样用于语音识别的,识别过程如图
前向算法即按输出观察值序列的时间,从前向后递推计算输出概率。
下列符号的定义:
利用前向递推算法计算aab的输出概率的全过程如图3-8所示。