开篇
拖了很久,现在补上概率图的几个模型,陆续补上这部分的内容。概率算是机器学习里面比较抽象和难以理解的模型,它很多时候被应用在自然语言上的一些基本,想是词性标注,命名实体。
概率图模型,知乎上的一个博客,文章里面有不少数学符号有问题,但是整体框架还是很清晰,大家可以扫一下,不要刻意去抠细节。
有向图模型
HMM的定义
有向图里面一个经典的模型,隐马尔科模型,序列标注和中文分词的常见模型,当然它还被应用到声音识别。还是先看一下HMM的图,有个感性的认识
首先还是稍微提一下马尔科夫模型,这边也算填上我之前挖的坑,HMM是带隐变量的马尔科夫模型。
下面将是我的手写图片+文字描述,希望大家喜欢。
首先讲一下什么是马尔科夫模型,主要就是一个状态转移链,也就是上图中上面的一条状态链(i1->i4),并且每一个状态的产生概率只与前面的一个状态有关,这就是马尔科夫性假设。那么什么是隐马尔科夫模型,其实就如图所示,i状态我们看不到,也就是所谓的隐变量,也是我们的隐状态。那么图中的o又是什么呢,o就是我们能够观察到的状态。
举个简单的例子,我们有n个不同的硬币,但是硬币都只有正反两个面(抛出正面的概率各不相同),我们抛了k次硬币,这k次我们不知道都是那些硬币,也就是我们的隐状态,我们能够观测到的就是k次,每次硬币的正反结果,也就是我们的观测状态。当然n个硬币之间是有一定的转移概率的,比如说,我们