首先我是从https://www.zhihu.com/question/35866596和https://www.jianshu.com/p/55755fc649b1以及《数学之美》中学习的这三种概念,现在做个总结。
下面均已词性标注为例。
张三(名词)在(介词)星巴克(名词)喝(动词) 咖啡(名词)。
1.生成式:隐马尔科夫模型HMM
o观测值:张三
i状态值:名词
A:状态转移概率矩阵p(i2|i1) 即第一个是名词,第二个是介词的概率。
B:观测概率矩阵P(o2|i2) 即介词是在的概率。
HMM属于有向图,并且是生成式模型,直接对联合概率分布建模 (注意,这个公式不在模型运行的任何阶段能体现出来,只是我们都去这么来表示HMM是个生成式模型,他的联合概率
就是这么计算的)
2.判别式:MEMM最大熵马尔可夫模型
因为在实际应用中,状态是依赖观察值的,且MEMM是判别式,所以直接求学习条件概率。
特征函数
3.判别式CRF条件随机场