概率图模型

本文对比了自然语言处理中的隐马尔科夫模型(HMM)与条件随机场(CRF),阐述了两者在词性标注等任务中的应用及核心差异。HMM适用于时序数据,关注状态转移;CRF则能更好地处理上下文信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

      概率图模型广泛应用于自然语言处理各个领域,也是机器学习里面最难的一部分内容之一,应用包括贝叶斯,HMM,CRF等等,初学者很难理清楚之间的关系。本文算是一个总结吧,有不妥之处,欢迎指正。,下面这个图来自《自然语言处理》教程。

                       

      可以看到贝叶斯网络都是有向的。马尔科夫网无向。贝叶斯适合为有单项依赖的数据建模,马尔科夫网适合实体之间相互依赖的建模,它们的核心差异是怎样表示Y=(y1,y2,...,yn)这个联合概率。

      重点讲一讲NLP最重要的两个模型,隐马尔可夫模型与条件随机场,分析他们之间的关系。关于它们的建模公式与过程,网上有很多资料可以参考,我的github也有相应的资料可下载,欢迎大家访问:

https://github.com/lovesoft5/ml

     隐马尔科夫模型是关于时序的概率模型,描述由一个含有隐藏的马尔科夫随机生成的不可观测的状态随机序列,再由各个状态生成一个观测而产生的随机序列过程,整个模型包含了三个分布,这也是建模过程就是要确定这3个分布,以及根据这3个分布进行预测。即  1)初始概率分布    2)状态转移概率   3)观测概率分布

     隐马尔科夫模型是只依赖于每一个状态和它观察的对象,而条件随机场没有严格的独立假设条件,可以容纳任意的上下文信息,缺点就是复杂度高,这一点从条件睡机场模型的建模公式可以看到,隐马尔可夫模型是条件随机场的一个“特殊情况”,就是只考虑隐变量相邻的变量。一个很好理解的条件随机场定义: 设X是随机变量,P(Y|X)是给定X时Y的条件概率分布,若随机变量Y构成是一个马尔科夫随机场,则称条件概率分布P(Y|X)是条件随机场。

       条件随机场可以很好的应用于词性标注(是不是某个名词,比如地名,人名)等问题,比如自然语言中:动词后面还是一个动词我们可以认为这是一个针对句子的特征函数,这样,我们就可以定义一个特征函数集合,用这个特征函数集合来标注一个序列并进行打分,以此来找出最靠谱的标注序列。也就是说,每一个特征函数都可以用来作为一个标注序列评分,把集合中所有的特征函数对同一个标注序列的评分综合起来就是这个标注序列的最终评分值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值