【机器学习系列】隐马尔科夫模型第一讲：通俗易懂概述HMM

最新推荐文章于 2025-06-25 09:42:06 发布

CHEONG_KG

最新推荐文章于 2025-06-25 09:42:06 发布

阅读量695

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习算法 HMM 隐马尔科夫模型概率图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/feilong_csdn/article/details/117289699

机器学习专栏收录该内容

44 篇文章

订阅专栏

作者：CHEONG

公众号：AI机器学习与知识图谱

研究方向：自然语言处理与知识图谱

阅读本文之前，首先注意以下两点：

1、机器学习系列文章常含有大量公式推导证明，为了更好理解，文章在最开始会给出本文的重要结论，方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。

2、文中含有大量公式，若读者需要获取含公式原稿Word文档，可关注公众号后回复：HMM第一讲，本文主要从隐马尔科夫模型背景、定义、两大假设和三个问题来理解HMM。

一、初识HMM

先从整体角度认识一下隐马尔科夫模型HMM，如下图所示，HMM是一种加了时序信息的概率图模型，并且是混合模型。HMM和高斯混合模型GMM有两个明显的区别，其一是HMM含有时序信息，其二是HMM模型状态变量之间非独立的，而GMM的状态变量间是相互独立的。HMM、Kalman Filter和Particle Filter都属于时序混合概率图模型，但HMM状态变量是离散的，Kalman Filter和Particle Filter的状态变量是连续的，且Kalman Filter是线性的，而Particle Filter是非线性的。

在这里插入图片描述

二、HMM定义

隐马尔可夫模型描述的是由隐藏的马尔可夫链随机生成观测序列的过程，属于生成模型，常应用在标注问题、语音识别等领域。首先明确一下马尔科夫的定义：

1．状态集合 $Z$

2．观测集合 $X$

3．状态转移概率矩阵 $A$

4．观测概率矩阵 $B$

5．初始状态概率 $\pi$

在这里插入图片描述

观测变量：

在这里插入图片描述

状态变量：

在这里插入图片描述

$A$ 表示状态转移概率矩阵、 $B$ 表示观测概率矩阵、 $\pi$ 表示初始状态概率向量

在这里插入图片描述

隐马尔科夫概率图如下所示：

在这里插入图片描述

三、HMM两个重要假设

1．齐次马尔可夫假设：隐藏的马尔可夫链在任意时刻的状态只依赖于前一时刻的状态，与其他状态以及观测序列无关

在这里插入图片描述

2．观测独立假设：任意时刻的观测只依赖于当前时刻隐马尔可夫链的状态，与其他观测和状态无关

在这里插入图片描述

四、HMM三大问题

1．Evaluation问题：已知参数 $\lambda=(\pi,A,B)$ ，输出观测序列 $O$ 的概率 $p(O|\lambda)$ 有多大

解决算法：前向算法、后向算法

2．Learning问题：参数估计问题，即如何求解参数 $\lambda=(\pi,A,B)$ ，使用EM算法求解

在这里插入图片描述

3．Decoding问题：已知观测序列 $X$ ，求解使得 $p (Z ∣ X)$ 最大的隐状态序列 $Z$ ，公式表示为：

在这里插入图片描述

从而可引申出两个问题，预测问题： $p(i_{t+1}|o_1,o_2,...,o_t)$ ；滤波问题： $p(i_{t}|o_1,o_2,...,o_t)$

三、往期精彩

【知识图谱系列】Over-Smoothing 2020综述

【知识图谱系列】基于生成式的知识图谱预训练模型

【知识图谱系列】基于2D卷积的知识图谱嵌入

【知识图谱系列】基于实数或复数空间的知识图谱嵌入

【知识图谱系列】自适应深度和广度图神经网络模型

【知识图谱系列】知识图谱多跳推理之强化学习

【知识图谱系列】知识图谱的神经符号逻辑推理

【知识图谱系列】动态时序知识图谱EvolveGCN

【知识图谱系列】多关系神经网络CompGCN

【知识图谱系列】探索DeepGNN中Over-Smoothing问题

【知识图谱系列】知识图谱表示学习综述 | 近30篇优秀论文串讲

【知识图谱系列】动态知识图谱表示学习综述 | 十篇优秀论文导读

【面经系列】八位硕博大佬的字节之旅

【机器学习系列】机器学习中的两大学派

各大AI研究院共35场NLP算法岗面经奉上

干货 | Attention注意力机制超全综述

干货 | NLP中的十个预训练模型

干货|一文弄懂机器学习中偏差和方差

FastText原理和文本分类实战，看这一篇就够了

Transformer模型细节理解及Tensorflow实现

GPT,GPT2,Bert,Transformer-XL,XLNet论文阅读速递

机器学习算法篇：最大似然估计证明最小二乘法合理性

Word2vec, Fasttext, Glove, Elmo, Bert, Flair训练词向量教程+数据+源码

原稿获取请关注公众号后回复：HMM第一讲 ，原创不易，有用就点个赞呀！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。