原文地址:概率图几种模型的简介和比较
作者:小腹黑zju
基础知识
G(V,E):变量关系图
V:顶点or节点,表示随机变量
E:边or弧
两个节点邻接:两个节点之间存在边,记为Xi ~Xj ,不存在边,表示条件独立。
路径:若对每个i,都有Xi-1 ~ Xi ,则称序列(X1, X2 ... XN )是一条路径。
几种概率图模型:
- 朴素贝叶斯分类器(NBs:Naive Bayes)
- 最大熵模型(MEM:Maximum Entropy Model)
- 隐马尔可夫模型(HMM:Hidden Markov Models)
- 最大熵马尔可夫模型(MEMM:Maximum Entropy Markov Model)
- 马尔可夫随机场(MRF:Markov Random Fields)
- 条件随机场(CRF:Conditional Random Fields)
1.NBs
贝叶斯定理
![[转载]概率图几种模型的简介和比较 [转载]概率图几种模型的简介和比较](https://i-blog.csdnimg.cn/blog_migrate/a4c26d1e5885305701be709a3d33442f.gif)
一般来说,x已给出,P(x)也是一个定值(虽然不知道准确的数据,但因为是恒值,可以忽略),只需关注分子P(x|yi)P(yi)。P(yi)是类别yi的先验概率,P(x|yi)是x对类别yi的条件概率。
贝叶斯定理说明了可以用先验概率P(yi)来估算后验概率P(x|yi)。
贝叶斯分类器
贝叶斯网络(Bayesian Network)
概率图示意
每个节点的条件概率分布表示为:P(当前节点|它的父节点)。
举例:
2.MEM
概率图示意
最大熵推导过程省略,直接给出最后的模型公式——指数形式
3.HMM
概率示意图
状态序列和观察序列的联合概率
4.MEMM
概率图示意
状态yi 的条件概率公式(每个i 的状态输出都服从最大熵的指数模型)
其中Z是归一化因子,是对分子的所有ys = y1, y2,…, yn求和得到。T是个温度常数(一般取1)。U(y1, y2,…, yn)一般称为能量函数(energy function),定义为在MRF上所有团势(clique-potential)之和。
6.CRF
一阶链式CRF示意图(不同于隐马尔科夫链,
条件随机场中的
x
i
除了依赖于当前状态,还可能与其他状态有关
)
令 X=(x1, x2,…, xn)表示观察序列, Y=(y1, y2,…, yn)是有限状态的集合。
根据随机场的基本理论,
无向图中关于顶点的标记条件概率
几种比较
条件随机场和隐马尔科夫链的关系和比较
- 不同点:观察值xi不单纯地依赖于当前状态yi,可能还与前后状态有关;
- 相同点:条件随机场保留了状态序列的马尔科夫链属性——状态序列中的某一个状态只与之前的状态有关,而与其他状态无关。(比如句法分析中的句子成分)
MRF和CRF的关系和比较