【机器学习】隐马尔可夫(一)----模型定义

隐马尔可夫模型解析

最新推荐文章于 2024-03-12 15:53:35 发布

htshinichi

最新推荐文章于 2024-03-12 15:53:35 发布

阅读量410

点赞数

CC 4.0 BY-SA版权

分类专栏：学习笔记文章标签：机器学统马尔可

本文链接：https://blog.youkuaiyun.com/u013597931/article/details/80571732

学习笔记专栏收录该内容

27 篇文章

订阅专栏

本文探讨了如何利用隐马尔可夫模型(HMM)分析个人心理状态变化，并介绍了HMM的基本假设、模型参数、状态转移概率矩阵等概念。同时，文章详细解释了HMM的三个基本问题：概率计算问题、学习问题和预测问题。

咸鱼了一个多月，黑色五月过得异常难受，找实习好烦，心态一直调整不好。
然后。。突然就想起了隐马尔可夫，我每天的心理状态是别人无法观测到的，每一天的状态组在一起就是一个状态序列，而我的行为活动是其他人可见的，每一天的行为组合在一起就是观测序列，当知道我月初的各种状态的概率分布，也知道了我这个人每种状态转移的概率分布和在某种状态下做出某种行为活动的概率分布时，是不是就能通过我这一个月每天的行为活动组成的序列来判断我每天的状态呢。emmm，隐马尔可夫带你成为一个能看懂人心的“神棍”。

基本假设

首先为了计算简单，要提出两点假设：
第一、齐次马尔可夫性假设
假设隐藏的马尔可夫链在任意时刻 $t$ 的状态只依赖于其前一时刻 $t-1$ 的状态，与其他时刻的状态及观测无关，也与时刻 $t$ 无关。
即 $P(i_t|i_{t-1},o_{t-1},...,i_1,o_1)=P(i_t|i_{t-1})$ $t=1,2,...,T$
第二、观测独立性假设
假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测及状态无关。
即 $P(o_t|i_T,o_T,i_{T-1},o_{T-1},...,i_t,o_t,...,i_1,o_1)=P(o_t|i_t)$

这两个假设一个是状态转移的关系，另一个是状态生成观测的关系。

模型参数(A,B,π)

隐马尔可夫模型是一个关于时序的概率模型，它由初始状态概率向量 $π$ ，状态转移概率矩阵 $A$ 和观测概率分布 $B$ 来确定。模型用 $λ$ 表示， $λ=(A,B,π)$ 可以用来预测给定的观测序列对应的状态序列。

状态
用 $i_t$ 表示 $t$ 时刻的状态， $i_1$ 是第一天的状态(也就是初始状态)。
用 $q$ 表示所有可能的状态，集合表示为 $Q=\{q_1,q_2,...,q_N\}$ ， $N$ 即有 $N$ 种状态。
$P(i_t=q_j)$ 表示第 $t$ 天( $t$ 时刻)的状态是 $q_j$ 的概率， $j$ 取 $1,2,...,N$
$\color{red}{比如花丸的所有可能状态包括\{烦躁，消极，平静，积极\}}$
观测
用 $o_t$ 表示 $t$ 时刻的观测(行为活动)。
用 $v$ 表示所有可能的观测(行为活动)，集合表示为 $V=\{v_1,v_2,...,v_M\}$ ， $M$ 即有 $M$ 种观测。
$P(o_t=v_s|i_t=q_j)$ 表示在第 $t$ 天( $t$ 时刻)状态是 $q_j$ 的条件下，第 $t$ 天( $t$ 时刻)观测到的活动是 $v_s$ 的概率， $s$ 取 $1,2,...,M$
$\color{red}{比如花丸的所有可能活动包括\{玩游戏，写博客，看书，看电影，无所事事\}}$

状态转移概率矩阵 $A$ ：

$A=[a_{jk}]_{N\times N}$ ，即一个 $N\times N$ 的矩阵， $N$ 即有 $N$ 种状态。
其中 $a_{jk}=P(i_{t+1}=q_k|i_t=q_j)$ ，即在第 $t$ 天( $t$ 时刻)的状态是 $q_j$ 的条件下在第 $t+1$ 天( $t+1$ 时刻)转移到状态 $q_k$ 的概率。
如下图的状态转移
这里写图片描述

A = ⎡ ⎣ ⎢ ⎢ ⎢ a 11 a 21 a 31 a 41 a 12 a 22 a 32 a 42 a 13 a 23 a 33 a 43 a 14 a 24 a 34 a 44 ⎤ ⎦ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ 0 0.6 00 0.9 0 0.5 0 0.1 0.4 0 0.7 00 0.5 0.3 ⎤ ⎦ ⎥ ⎥ ⎥

$\color{red}{A= \begin{bmatrix} a_{11} & a_{12} & a_{13} &a_{14}\\ a_{21} & a_{22} & a_{23} &a_{24}\\ a_{31} & a_{32} & a_{33} &a_{34}\\ a_{41} & a_{42} & a_{43} &a_{44}\\ \end{bmatrix}=\begin{bmatrix} 0&0.9&0.1&0\\ 0.6&0&0.4&0\\ 0&0.5&0&0.5\\ 0&0&0.7&0.3\\ \end{bmatrix}}$
我们可以发现每一行之和为1，这是从某一状态转移为其他所有可能状态的概率之和。

观测概率矩阵 $B$ ：

$B=[b_j(s)]_{N\times M}$ ，即一个 $N\times M$ 的矩阵， $N$ 即有 $N$ 种状态， $M$ 即有 $M$ 种观测。
其中 $b_j(s)=P(o_t=v_s|i_t=q_j)$ ，即在第 $t$ 天( $t$ 时刻)处于状态 $q_j$ 的条件下生成观测 $v_s$ 的概率。
如下图状态生成观测，每种状态生成所有观测的概率之和为1(用同色的线表示在同一行)
这里写图片描述

A = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ b 1 (1) b 2 (1) b 3 (1) b 4 (1) b 1 (2) b 2 (2) b 3 (2) b 4 (2) b 1 (3) b 2 (3) b 3 (3) b 4 (3) b 1 (4) b 2 (4) b 3 (4) b 4 (4) b 1 (5) b 2 (5) b 3 (5) b 4 (5) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ 0.3 0.6 0.3 0.05 0.4 0.15 0.1 0.02 0.2 0.2 0.1 0.08 0.06 0.02 0.25 0.4 0.04 0.03 0.25 0.45 ⎤ ⎦ ⎥ ⎥ ⎥

$\color{red}{A= \begin{bmatrix} b_1(1) & b_1(2) & b_1(3) &b_1(4)&b_1(5)\\ b_2(1) & b_2(2) & b_2(3) &b_2(4)&b_2(5)\\ b_3(1) & b_3(2) & b_3(3) &b_3(4)&b_3(5)\\ b_4(1) & b_4(2) & b_4(3) &b_4(4)&b_4(5)\\ \end{bmatrix}=\begin{bmatrix} 0.3&0.4&0.2&0.06&0.04\\ 0.6&0.15&0.2&0.02&0.03\\ 0.3&0.1&0.1&0.25&0.25\\ 0.05&0.02&0.08&0.4&0.45\\ \end{bmatrix}}$

初始状态概率向量 $π$ ：

$π=(π_1,π_2,...,π_i)$ ， $π_i=P(i_1=q_j)$ ， $i_1$ 表示初始状态。
$\color{red}{初始状态分布：π_1=P(i_1=烦躁)=0.6，π_2=P(i_1=消极)=0.25}$
$\color{red}{π_3=P(i_1=平静)=0.1，π_4=P(i_1=积极)=0.05}$
$\color{red}{因此π=(0.6,0.25,0.1,0.05)}$