目前基于 CRFs 的主要系统实现有 CRF,FlexCRF,CRF++
缺点:训练代价大、复杂度高
—预备知识
—产生式模型和判别式模型(Generative model vs. Discriminative model)
—概率图模型
—隐马尔科夫模型
—最大熵模型
机器学习方法的两种分类:产生式模型和判别式模型
假定输入x, 类别标签y
—产生式模型(生成模型)估计联合概率 P(x, y), 因可以根据联合概率来生成样本 —: HMMs
—判别式模型(判别模型)估计条件概率 P(y|x), 因为没有x的知识,无法生成样本,只能判断分类: SVMs,CRF,MEM
一个举例:
(1,0), (1,0), (2,0), (2, 1)
产生式模型:
p(x, y):
P(1, 0) = 1/2, P(1, 1) = 0, P(2, 0) = 1/4, P(2, 1) = 1/4.
判别式模型:
P(y|x):
P(0|1) = 1, P(1|1) = 0, P(0|2) = 1/2, P(1|2) = 1/2
—o和s分别代表观察序列和标记序列
—产生式模型
—
—判别式模型
—
—产生式模型中,观察序列作为模型的一部分;
—判别式模型中,观察序列只作为条件,因此可以针对观察序列设计灵活的特征。
产生式模型:无穷样本==》概率密度模型 = 产生模型==》预测
判别式模型:有限样本==》判别函数 = 预测模型==》预测
概率图模型
—用图的形式表示概率分布
—基于概率论中贝叶斯规则建立起来的,解决不确定性问题,可以用于人工智能、 数据挖掘、 语言处理文本分类等领域
—根据边是否有方向,有两种主要的图模型
◦无向图:亦称马尔科夫随机场(Markov Random Fields, MRF’s)或马尔科夫网络(Markov Networks)
◦有向图:亦称贝叶斯网络(Bayesian Networks)或信念网络(Belief Networks, BN’s).
◦还有混合图模型,有时称为链图(chain graphs)
—我们不妨拿种地来打个比方。其中有两个概念:位置(site),相空间(phase space)。“位置”好比是一亩亩农田;“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼,这就好比给随机场的每个“位置”,赋予相空间里不同的值。所以,俗气点说,随机场就是在哪块地里种什么庄稼的事情。
—简单地讲,随机场可以看成是一组随机变量的集合(这组随机变量对应同一个样本空间)。当给每一个位置中按照某种分布随机赋予相空间的一个值之后,其全体就叫做随机场。
—当然,这些随机变量之间可能有依赖关系,一般来说,也只有当这些变量之间有依赖关系的时候,我们将其单独拿出来看成一个随机场才有实际意义。
—具有马尔科夫性质
—体现了一个思想:离当前因素比较遥远(这个遥远要根据具体情况自己定义)的因素对当前因素的性质影响不大。
本文来自优快云博客,转载请标明出处:http://blog.youkuaiyun.com/wen718/archive/2010/10/23/5960820.aspx
CRF其实就是一种在生产模型基础上的判别模型?
目前基于 CRFs 的主要系统实现有 CRF,FlexCRF,CRF++
缺点:训练代价大、复杂度高
———————————
——————————————–
。。。 。。。
Y* = arg max(y)P(Y|W)
目前我发现的关于CRF的实现有:
* CRF++(http://crfpp.sourceforge.net/)
* Pocket CRF(http://sourceforge.net/project/showfiles.php?group_id=201943)
Justin's Graphical Models / Conditional Random Field Toolbox
http://phd.gccis.rit.edu/justindomke/JGMT/#binarydenoising
关于CRF简介及代码实现的网址:http://www.inference.phy.cam.ac.uk/hmw26/crf/#software