基本概念
模型组成
- 状态转移矩阵:A
- 观测概率分布矩阵: B
- **初始状态概率向量:ππ
- **
隐马尔可夫模型:λλ
λλ = (A,B,π)(A,B,π), 其中,A=[aij]N∗NA=[aij]N∗N,
aij=P(it+1|it=qi)aij=P(it+1|it=qi)的概率,i = 1, 2, …,N , j = 1, 2,….N
B=[bj(k)]N∗MB=[bj(k)]N∗M,
其中,bj(k)=P(ot=vk|it=qj)bj(k)=P(ot=vk|it=qj), k = 1, 2,… M; j = 1, 2, …., N
是在t时刻处于状态qjqj的条件下生成观测vkvk的概率
πiπi是初始状态概率向量,其中,
πi=P(i1=qi)πi=P(i1=qi)是t = 1的时刻处于状态qiqi的概率,i = 1,2,….N,
两个基本假设
- 齐次马尔科夫性假设,即假设隐藏的马尔科夫链在任意时刻t的状态只依赖于前一时刻的状态,与其他时刻的状态及观测无关,也与时刻t无关,
P(it|it−1,ot−1,...i1,o1)=P(it|it−1)P(it|it−1,ot−1,...i1,o1)=P(it|it−1)
-观测独立性假设,即假设任意时刻的观测只依赖于该时刻的马尔科夫链的状态,与其他观测及状态无关
P(ot|iT,oT,iT−1,oT−1,...i1,o1,)=P(ot|it)P(ot|iT,oT,iT−1,oT−1,...i1,o1,)=P(ot|it)
三个基本问题
- 概率计算问题,给定模型λλ = (A,B,π)(A,B,π), 和观测序列O=(o1,o2,...,oT)O=(o1,o2,...,oT) , 计算在模型λλ 下观测序列O出现的概率P(O|λ)P(O|λ)
- 学习问题,已知观测序列O=(o1,o2,...,oT)O=(o1,o2,...,oT), 估计模型λλ = (A,B,π)(A,B,π)为参数,使得在该模型下P(O|λ)P(O|λ) 最大,即用极大似然估计法估计参数
- 预测问题:已知模型λλ = (A,B,π)(A,B,π)和观测序列O=(o1,o2,...,oT)O=(o1,o2,...,oT) 求给定观测条件序列条件概率P(O|λ)P(O|λ)最大的状态序列I=(i1,i2,i3,...iT)I=(i1,i2,i3,...iT),即给定观测序列,求最有可能的状态序列
参考资料
李航 统计学习方法