通过hmmlearn学习使用HMM隐马尔科夫模型

最新推荐文章于 2025-03-08 09:44:56 发布

姚贤贤

最新推荐文章于 2025-03-08 09:44:56 发布

阅读量2.1w

点赞数 16

分类专栏：机器学习文章标签： HMM 人工智能算法 Python hmmlearn 隐马尔可夫模型

本文链接：https://blog.youkuaiyun.com/u011311291/article/details/78722262

版权

机器学习专栏收录该内容

85 篇文章

订阅专栏

一.了解隐马尔科夫模型(HMM)
具体可参考https://www.zhihu.com/question/20962240，讲得很通俗易懂。
本文使用的是hmmlearn模块，可以使用pip install hmmlearn安装。

二.HMM主要解决的三个问题。
假设隐藏状态序列和观测状态序列分别使用Z和X表示，则解决的3个问题可表示为:
1.解码问题：已知模型参数和X，估计最可能的Z；维特比算法
2.概率问题：已知模型参数和X，估计X出现的概率；向前-向后算法
3.学习问题：仅给出X和隐藏层个数，估计模型参数。 B-W算法，通常是经过一定数量的训练以后，得到模型，然后解决问题1和2。
注意：
对于估计模型参数，其实质是给出隐藏层和可观测层之间的转换模型，而用我下面举的例子，并不能反推出model.startprob_开始转移矩阵，也不能推出隐藏层的混淆矩阵model.transmat_，而且估计出的隐藏层和可观测层的转换矩阵行列顺序不固定，也就是说不能估算出Rainy->[0.1, 0.4, 0.5],有时为Sunny->[0.1, 0.4, 0.5]。

三.HMM常用的三种模型
1.GaussianHMM 观测状态连续型且符合高斯分布
2.GMMHMM 观测状态连续型且符合混合高斯分布
3.MultinomialHMM 观测状态离散型

四.MultinomialHMM使用实例

#coding=utf-8
'''
Created on 2017-12-4

本例为天气和行为的关系
'''
import numpy as np
import matplotlib.pyplot as plt
# hmmlearn可以在安装numpy以后，再使用pip install hmmlearn安装
from hmmlearn import hmm

states = ["Rainy", "Sunny"]##隐藏状态
n_states = len(states)##隐藏状态长度

observations = ["walk", "shop", "clean"]##可观察的状态
n_observations = len(observations)##可观察序列的长度

start_probability = np.array([0.6, 0.4])##开始转移概率，即开始是Rainy和Sunny的概率
##隐藏间天气转移混淆矩阵，即Rainy和Sunny之间的转换关系，例如[0,0]表示今天Rainy，明天Rainy的概率
transition_probability = np.array([
  [0.7, 0.3],
  [0.4, 0.6]
])
##隐藏状态天气和可视行为混淆矩阵，例如[0,0]表示今天Rainy，walk行为的概率为0.1
emission_probability = np.array([
  [0.1, 0.4, 0.5],
  [0.6, 0.3, 0.1]
])

#构建了一个MultinomialHMM模型，这模型包括开始的转移概率，隐藏间天气转换混淆矩阵（transmat），隐藏状态天气和可视行为混淆矩阵emissionprob，对模型参数初始化
model = hmm.MultinomialHMM(n_components=n_states)
model.startprob_= start_probability
model.transmat_ = transition_probability
model.emissionprob_ = emission_probability

#给出一个可见序列
bob_Actions = np.array([[2, 0, 1, 1, 2, 0]]).T

# 解决问题1,解码问题,已知模型参数和X，估计最可能的Z； 维特比算法 
logprob, weathers = model.decode(bob_Actions, algorithm="viterbi")
print "Bob Actions:", ", ".join(map(lambda x: observations[x], bob_Actions))
print "weathers:", ", ".join(map(lambda x: states[x], weathers))
print logprob#该参数反映模型拟合的好坏,数值越大越好
# 解决问题2,概率问题，已知模型参数和X，估计X出现的概率, 向前-向后算法 
score = model.score(bob_Actions, lengths=None)
#最后输出结果
print score
# 结果为-6.892170869，其实真正的概率是以自然数e为底数ln(P) = -6.892170869,所以概率P = 0.00101570648021
# import math
# print math.exp(-6.892170869)

# 解决问题3，学习问题，仅给出X，估计模型参数,鲍姆-韦尔奇算法，其实就是基于EM算法的求解
# 解决这个问题需要X的有一定的数据量，然后通过model.fit(X, lengths=None)来进行训练然后自己生成一个模型
# 并不需要设置model.startprob_,model.transmat_,model.emissionprob_
# 例如:
# import numpy as np
# from hmmlearn import hmm
#  
# states = ["Rainy", "Sunny"]##隐藏状态
# n_states = len(states)##隐藏状态长度
#  
# observations = ["walk", "shop", "clean"]##可观察的状态
# n_observations = len(observations)##可观察序列的长度
#  
# model = hmm.MultinomialHMM(n_components=n_states, n_iter=1000, tol=0.01)
#  
# X = np.array([[2, 0, 1, 1, 2, 0],[0, 0, 1, 1, 2, 0],[2, 1, 2, 1, 2, 0]])
# model.fit(X)
# print model.startprob_
# print model.transmat_
# print model.emissionprob_
## [[  1.11111111e-01   2.22222222e-01   6.66666667e-01]
##  [  5.55555556e-01   4.44444444e-01   6.27814351e-28]]
# print model.score(X)
# model.fit(X)
# print model.startprob_
# print model.transmat_
# print model.emissionprob_
# 和第一次fit(X)得到的行顺序不一样
## [[  5.55555556e-01   4.44444444e-01   9.29759770e-28]
##  [  1.11111111e-01   2.22222222e-01   6.66666667e-01]]
# print model.score(X)
# model.fit(X)
# print model.startprob_
# print model.transmat_
# print model.emissionprob_
# print model.score(X)
# # 可以进行多次fit,然后拿评分最高的模型，就可以预测了
# print model.predict(bob_Actions, lengths=None)
# # 预测最可能的隐藏状态
# # 例如:
# # [0 1 0 0 0 1]
# print model.predict_proba(bob_Actions, lengths=None)# 预测各个隐藏状态的概率
# # 例如:
# # [[ 0.82770645  0.17229355]
# #  [ 0.27361913  0.72638087]
# #  [ 0.58700959  0.41299041]
# #  [ 0.69861348  0.30138652]
# #  [ 0.81799813  0.18200187]
# #  [ 0.24723966  0.75276034]]
# # 在生成的模型中，可以随机生成随机生成一个模型的Z和X
# X,Z = model.sample(n_samples=5, random_state=None)
# print "Bob Actions:", ", ".join(map(lambda x: observations[x], X))
# print "weathers:", ", ".join(map(lambda x: states[x], Z))


# # 保存模型
# import pickle
# output = open('D:\\xxx\\data1111.pkl', 'wb')
# s = pickle.dump(model, output)
# output.close()
# # 调用模型
# input = open('D:\\xxx\\data.pkl', 'rb')
# model = pickle.load(model)
# input.close()
# model.predict(X)

五.隐马可夫模型参数设置，属性设置，模型函数(参考于http://blog.youkuaiyun.com/zhydw317/article/details/78418750?locationNum=1&fps=1)

模型参数：
n_components : 隐藏状态数目
covariance_type: 协方差矩阵的类型
min_covar : 最小方差，防止过拟合
startprob_prior : 初始概率向量
transmat_prior : 转移状态矩阵
means_prior, means_weight : 均值
covars_prior, covars_weight : 协方差
algorithm : 所用算法
random_state : 随机数种子
n_iter : 最大迭代次数
tol : 停机阈值
verbose : 是否打印日志以观察是否已收敛
params : 决定哪些参数在迭代中更新
init_params : 决定哪些参数在迭代前先初始化

模型属性:
n_features：n维高斯分布
monitor_：收敛监测
transmat_：转移矩阵
startprob_：初始向量
means_：均值
covars_：方差

模型常用函数调用:
decode(X, lengths=None, algorithm=None)，返回最可能的隐藏状态
sample(n_samples=1, random_state=None)，随机生成一个模型的Z和X
fit(X, lengths=None) ，估计模型参数
predict(X, lengths=None) ，预测最可能的隐藏状态
predict_proba(X, lengths=None) ，预测各状态的概率
score(X, lengths=None) ，当前模型下出现X的概率

六.隐马可夫模型常用领域
1.语音识别，使用的就是第一问题，解码问题
2.股票预测，使用的问题2，预测概率问题
3.XSS攻击检测，使用的问题2，预测概率问题
对于XSS攻击，首先我们需要对数据进行泛化,比如：
[a-zA-Z]泛化为A
[0-9]泛化为N
[-_]泛化为C
其他字符泛化为T
其中ANCT为可观测离散值，则对于URL中有字符串uid=admin123，则有:
admin123->AAAAANNN，而uid=%3Cscript->TNAAAAAAA。
假设我们只训练白样本，生成模型，则当识别一个白样本时score值就很高，然后拿去识别XSS，带有XSS黑样本的score值就会很低。