首先来讨论上节课讲的公式,其中K指的是yt各种状态的个数|S|与yt-1个数的组合,一共是|S|^2种情况,K<=|S|*|S|
第一步,第二步的简化都是把累加变为列向量与行向量的乘积。
概率图模型的任务分两大类:
learning:就是把参数学习出来
inference: 边缘概率;条件概率;解码问题
把P(y|x)除了yt之外的都积分掉,
用到的是概率图模型种的变量消除法。
学习问题:主要就是用梯度上升算法。
求解下式
上式是配分函数,求导后对应充分统计量的期望。
用A函数代表P这一部分的概率已经求出来。
贴一张图来简要说明HMM和CRF的区别: