【机器学习】隐马尔可夫（hmm）从原理到代码学习记录

最新推荐文章于 2025-04-25 02:14:37 发布

zero-L

最新推荐文章于 2025-04-25 02:14:37 发布

阅读量1.7k

点赞数 2

分类专栏：机器学习文章标签： hmm 机器学习

本文链接：https://blog.youkuaiyun.com/weixin_39938635/article/details/117257164

版权

本文介绍了隐马尔可夫模型（HMM）的基本概念，如可见状态链、隐含状态链、转换概率和输出概率，并通过掷骰子的例子进行解释。文章详细阐述了HMM的主要应用场景，包括预测最可能的隐含状态、计算结果出现的概率以及仅凭输出数据估计模型参数。接着，讲解了维比特算法、前后向算法和EM算法在解决HMM问题中的应用。此外，还介绍了Python库hmmlearn的使用方法和模型参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概念

先熟悉下隐马尔可夫是什么。知乎上的高赞讲得很清晰明了。其他回答对我的理解也很有帮助。
知乎传送门：如何用简单易懂的例子解释隐马尔可夫模型？

举个栗子¹

用最经典的例子，掷骰子。假设我手里有三个不同的骰子。
第一个骰子是我们平常见的骰子（称这个骰子为D6），6个面，每个面（1，2，3，4，5，6）出现的概率是1/6。
第二个骰子是个四面体（称这个骰子为D4），每个面（1，2，3，4）出现的概率是1/4。
第三个骰子有八个面（称这个骰子为D8），每个面（1，2，3，4，5，6，7，8）出现的概率是1/8。

在这里插入图片描述

可见状态链、隐含状态链、转换概率以及输出概率

假设我们开始掷骰子，我们先从三个骰子里挑一个，挑到每一个骰子的概率都是1/3。然后我们掷骰子，得到一个数字，1，2，3，4，5，6，7，8中的一个。不停的重复上述过程，我们会得到一串数字，每个数字都是1，2，3，4，5，6，7，8中的一个。例如我们可能得到这么一串数字（掷骰子10次）：1 6 3 5 2 7 3 5 2 4。这串数字叫做可见状态链。
但是在隐马尔可夫模型中，我们不仅仅有这么一串可见状态链，还有一串隐含状态链。在这个例子里，这串隐含状态链就是你用的骰子的序列。比如，隐含状态链有可能是：D6 D8 D8 D6 D4 D8 D6 D6 D4 D8。
一般来说，HMM中说到的马尔可夫链其实是指隐含状态链，因为隐含状态（骰子）之间存在转换概率（transition probability）。在我们这个例子里，D6的下一个状态是D4，D6，D8的概率都是1/3。D4，D8的下一个状态是D4，D6，D8的转换概率也都一样是1/3。这样设定是为了最开始容易说清楚，但是我们其实是可以随意设定转换概率的。比如，我们可以这样定义，D6后面不能接D4，D6后面是D6的概率是0.9，是D8的概率是0.1。这样就是一个新的HMM。
同样的，尽管可见状态之间没有转换概率，但是隐含状态和可见状态之间有一个概率叫做输出概率（emission probability）。就我们的例子来说，六面骰（D6）产生1的输出概率是1/6。产生2，3，4，5，6的概率也都是1/6。我们同样可以对输出概率进行其他定义。比如，我有一个被赌场动过手脚的六面骰子，掷出来是1的概率更大，是1/2，掷出来是2，3，4，5，6的概率是1/10。
在这里插入图片描述

HMM主要解决的问题

和HMM模型相关的算法主要有以下三类：

1.给定模型的参数和观察到的数据，预测最有可能的隐含状态

Given the model parameters and observed data, estimate the optimal sequence of hidden states.²

知道骰子有几种（隐含状态数量），每种骰子是什么（转换概率），根据掷骰子掷出的结果（可见状态链），我想知道每次掷出来的都是哪种骰子（隐含状态链）。
这个问题呢，在语音识别领域呢，叫做解码问题。这个问题其实有两种解法，会给出两个不同的答案。每个答案都对，只不过这些答案的意义不一样。第一种解法求最大似然状态路径，说通俗点呢，就是我求一串骰子序列，这串骰子序列产生观测结果的概率最大。第二种解法呢，就不是求一组骰子序列了，而是求每次掷出的骰子分别是某种骰子的概率。比如说我看到结果后，我可以求得第一次掷骰子是D4的概率是0.5，D6的概率是0.3，D8的概率是0.2.第一种解法我会在下面说到，但是第二种解法我就不写在这里了，如果大家有兴趣，我们另开一个问题继续写吧。

2.给定模型的参数以及观察到的数据，算出出现这个结果的概率

Given the model parameters and observed data, calculate the model likelihood.²

还是知道骰子有几种（隐含状态数量），每种骰子是什么（转换概率），根据掷骰子掷出的结果（可见状态链），我想知道掷出这个结果的概率。
看似这个问题意义不大，因为你掷出来的结果很多时候都对应了一个比较大的概率。问这个问题的目的呢，其实是检测观察到的结果和已知的模型是否吻合。如果很多次结果都对应了比较小的概率，那么就说明我们已知的模型很有可能是错的，有人偷偷把我们的骰子給换了。