生物统计学(biostatistics)笔记-3.HMM

目录

Markov Model

1、概念

2、特点

3、不动点计算-迭代求结果直至收敛

*Markov Model的缘起-Page Rank的算法

Hidden Markov Model

1、与Markov chain区别

 2、模型

3、研究的数学问题

3.1 识别问题-由观测样本得到其来源

3.2 解码问题-由观测样本得到隐状态

3.3 学习问题-由观测样本得到三个参数

Viterbi算法实例

HMM应用 

1、基因序列CpG岛识别

CpG岛(CpG island)

模型框架

2、基因识别

2.1 先验知识(Prior Knowledge)

2.2 真核和原核的基因识别面临不同问题

2.3 算法举例

3、其他

考试重点

1、Markov model和HMM的概念

2、计算

        不动点的计算

        Viterbi算法

3、记忆HMM的应用,可能出大题


Markov Model

1、概念

  • 转移矩阵Transition metrics:A
  • 不动点state probablity vector(π):需要满足π为A的特征向量【πA=π】,且π的数值和为1(概率分布的特点)

2、特点

可达、互通、不可约,常返和周期性

3、不动点计算-迭代求结果直至收敛

  • 题目
  • 结果

*Markov Model的缘起-Page Rank的算法

*为补充内容

PageRank算法的基本想法是在有向图上定义一个随机游走模型,即一阶马尔可夫链,描述随机游走者沿着有向图随机访问各个结点的行为。在一定条件下,极限情况访问每个结点的概率收敛到平稳分布,这时各个结点的平稳概率值就是其PageRank值,表示结点的重要度。PageRank是递归定义的,PageRank的计算可以通过迭代算法进行。

一个网页,如果指向该网页的PageRank值越高,随机跳转到该网页的概率也就越高,该网页的PageRank值就越高,这个网页也就越重要。PageRank值依赖于网络的拓扑结构,一旦网络的拓扑(连接关系)确定,PageRank值就确定。

Hidden Markov Model

1、与Markov chain区别

  • 针对的问题:
    • 马尔科夫模型:通常用于描述一个系统的未来状态仅依赖于当前状态的概率模型,适用于状态可以直接观察到的情况。
    • 隐马尔科夫模型(HMM):用于描述一个含有隐含未知参数的马尔可夫过程,其中状态不能直接观察到,但可以通过观测向量序列观察到。
  • 模型参数:
    • 马尔科夫模型:状态转移概率
    • HMM:初始状态概率向量π、状态转移概率矩阵A和观测概率矩阵B。
  • 状态是否可观测:
    • 马尔科夫模型:状态是可以直接观察到的。
    • HMM:存在两种状态,一种是隐含状态(hidden states),这些状态不能直接观察到;另一种是观测状态(observation states),这些状态可以通过观测向量序列观察到。

 2、模型

  • 隐过程X
  • 观测过程Y
  • 模型参数:初始分布π,转移矩阵A,隐状态的分布矩阵B

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值