机器学习基础 之 概率图模型

本文深入探讨了概率图模型的核心概念,包括隐马尔可夫模型、马尔可夫随机场、条件随机场等,解析了学习与推断的方法,如极大似然估计、变量消去法,并介绍了话题模型在文本分析中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


转自: https://www.zhenxiangsimple.com/2019/04/12/tech-ml-gltmx/


隐马尔可夫模型

  隐马尔可夫模型是马尔可夫链的一种形式,马尔可夫链可以理解为一个状态变量受到其他所有状态的条件依赖关系,可以由一个状态代替,而不用去处理较多的状态,如果将状态使用时序表示,可以描述为系统的下一时刻的状态仅有当前时间状态决定,跟之前的状态无关。隐马尔可夫模型的状态值不能直接观察到,但能通过某个状态值推断出对应的观测值,同时而状态之间是一种马尔可夫链关系。
  该模型常用语语音识别和自然语言处理,在吴军老师的数学之美中有更简洁易懂的解释。

马尔可夫随机场

  马尔可夫随机场包含马尔可夫和随机两个概念,是一种满足马尔可夫性质的随机过程,马尔可夫简单说就是未来只跟现在有关,跟过去历史无关的一种样本状态;随机过程就是一连串随机状态的一种定量关系描述。整体来讲,马尔可夫随机场就是用于描述那些满足马尔可夫性质的随机状态的模型。
  全局马尔可夫性是指给定两个变量子集的分离集,则这两个变量子集条件独立;将其细化可以得到局部马尔可夫性和成对马尔可夫性两个推论,局部马尔可夫性指给定比变量的邻接变量,则该变量条件独立于其他变量,成对马尔可夫性指给定所有变量,两个非邻接的变量条件独立。

条件随机场

  条件随机场是一种判别式无向图,用于对多个变量在给定观测值后的条件概率进行建模,即对于一组给定随机分布的输入观测值,来建立随机分布的输出状态的条件概率分布模型。
  条件随机场跟上面的马尔可夫随机场的本质上一样,区别是马尔可夫随机场考虑的是观测变量之间联合概率,而条件随机场分析的是观测变量到状态的条件概率,换句话说条件随机场可以理解为研究给定随机观测变量条件下,状态随机变量的马尔可夫随机场。

学习与推断

  本节主要说概率图模型中对具体分布参数的学习和模型的推断,参数的学习可以使用极大似然估计或最大后验概率估计求解,若将参数视为待推测变量,则参数估计跟推断过程十分接近,可以吸收到推断问题中。常用的推断方法分为精确推断和近似推断两类,精确推断常用有变量消去法和信念传播法。
  变量消去法是基于图模型的条件独立性,把多个变量的积的求和问题转化为部分变量交替进行求和和求积问题,实现了对部分变量的消去;信念传播法是基于变量消去法的思想,对各变量进行累计和传播,更好的解决了多个边际分布的重复计算问题。

近似推断

  近似推断一般分为随机化采样和确定性近似两类,随机化采样的原理是直接使用样本进行目标期望值的计算,而不用先通过样本计算出概率分布,然后再基于分布计算对应的期望值,其中MCMC采样法是通过构造“平稳分布为p的马尔可夫链”来产生样本。变分推断是使用已知的简单分布来逼近需要推断的复杂分布的一种确定性近似方法。

话题模型

  话题模型主要用于处理离散型的数据,基本原理就类似对一篇文章进行话题划分的过程,主要也用于信息检索和自然语言处理领域。先对文章中出现词的词频进行统计,然后将词指派给不同话题,再通过话题来对词进行随机采样,最终可以使用话题来表示文档;或者说,一篇文章中的词是基于一定概率出现在某个话题中,而反过来某个话题也是以一定概率含有某个词。

点击查看 (人工智能) 系列文章


Statistical learning refers to a set of tools for modeling and understanding complex datasets. It is a recently developed area in statistics and blends with parallel developments in computer science and, in particular, machine learning. The field encompasses many methods such as the lasso and sparse regression, classification and regression trees, and boosting and support vector machines. With the explosion of “Big Data” problems, statistical learning has be- come a very hot field in many scientific areas as well as marketing, finance, and other business disciplines. People with statistical learning skills are in high demand. One of the first books in this area—The Elements of Statistical Learning (ESL) (Hastie, Tibshirani, and Friedman)—was published in 2001, with a second edition in 2009. ESL has become a popular text not only in statis- tics but also in related fields. One of the reasons for ESL’s popularity is its relatively accessible style. But ESL is intended for individuals with ad- vanced training in the mathematical sciences. An Introduction to Statistical Learning (ISL) arose from the perceived need for a broader and less tech- nical treatment of these topics. In this new book, we cover many of the same topics as ESL, but we concentrate more on the applications of the methods and less on the mathematical details. We have created labs illus- trating how to implement each of the statistical learning methods using the popular statistical software package R . These labs provide the reader with valuable hands-on experience.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

具身小站

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值