第14章 概率模型--马尔可夫随机场

本文详细介绍了马尔可夫随机场的概念及其数学表示,包括团、极大团的定义,以及如何通过势函数来表达变量间的依赖关系。此外,还探讨了条件独立性的全局马尔可夫性质,并给出了具体的例子。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

马尔可夫随机场(Markov Random Field,简称MRF)是典型的马尔可夫网,这是一种著名的无相图模型。图中每个节点表示一个或一组变量,节点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数(potential functions),亦称“因子”(factor),这是定义在变量子集上的非负实函数,主要用于定义概率分布函数
图2显示出一个简单的马尔可夫随机场。对于图中节点的一个子集,若其中任意两节点间都有边连接,则称该节点子集为一个“团”(clique)。若在一个团中加入令外任何一个节点都不再形成团,则称该团为“极大团”(maximal clique);换言之,极大团就是不能被其他团所包含的团。例如图2中,{x1,x2},{x1,x3},{x2,x4},{x2,x5},{x2,x6},{x3,x5},{x5,x6}{x1,x2},{x1,x3},{x2,x4},{x2,x5},{x2,x6},{x3,x5},{x5,x6}{x2,x5,x6}{x2,x5,x6}都是团,并且除了{x2,x5},{x2,x6}{x2,x5},{x2,x6}{x5,x6}{x5,x6}之外都是极大团;但是,因为{x2}{x2}{x3}{x3}之间缺乏连接,{x1,x2,x3}{x1,x2,x3}并不构成团。显然,每个节点至少出现在一个极大团中。

图2 一个简单的马尔可夫随机场

这里写图片描述

在马尔可夫随机场中,多个变量之间的联合概率分布能基于团分解为多个因子的乘积,每个因子仅与一个团相关。具体来说,对于nn个变量x={x1,x2,...,xn},所有团构成的集合为CC,与团QC对应的集合记为xQxQ,则联合概率P(x)P(x)定义为

P(x)=1ZQCψQ(xQ)2P(x)=1Z∏Q∈C⁡ψQ(xQ)(2)

其中ψQψQ为团QQ对应的势函数,用于对团Q中的变量关系进行建模,Z=xQCψQ(xQ)Z=∑x∏Q∈CψQ(xQ)为规范化因子,以确保P(x)P(x)是被正确定义的概率。在实际应用中,精确计算ZZ通常很困难,但许多任务往往并不需要获得Z的精确值。
显然,若变量个数较多,则团的数目将会很多(例如,所有相互连接的两个变量都会构成团),这就意味着式(2)会有很多乘积项,显然会给计算带来负担。注意到若团QQ不是极大团,则它必被一个极大团Q所包含,即xQxQxQ⊆xQ∗;这意味着变量xQxQ之间的关系不仅体现在势函数ψQψQ中,还体现在ψQψQ∗中。于是,联合概率P(x)P(x)可基于极大团来定义。假定所有极大团构成的集合为CC∗,则有
P(x)=1ZQCψQ(xQ)3P(x)=1Z∗∏Q∈C∗ψQ(xQ)(3)

其中Z=xQCψQ(xQ)Z∗=∑x⁡∏Q∈C∗⁡ψQ(xQ)为规范化因子。例如图2中x={x1,x2,...,x6}x={x1,x2,...,x6},联合概率分布为P(x)P(x)定义为
P(x)=1Zψ12(x1,x2)ψ13(x1,x3)ψ24(x2,x4)ψ35(x3,x5)ψ256(x2,x5,x6),P(x)=1Zψ12(x1,x2)ψ13(x1,x3)ψ24(x2,x4)ψ35(x3,x5)ψ256(x2,x5,x6),

其中,势函数ψ256(x2,x5,x6)ψ256(x2,x5,x6)定义在极大团{x2,x5,x6}{x2,x5,x6}上,由于它的存在,使我们不再需要为团{x2,x5},{x2,x6}{x2,x5},{x2,x6}{x5,x6}{x5,x6}构建势函数。
在马尔可夫随机场中如何得到“条件独立性”呢?同样借助“分离”的概念,如图3所示,若从节点集AA中的节点到B中的节点都必须经过节点集CC中的节点,则称节点集ABB被节点集C分离,CC称为“分离集”(Separating Set)。对马尔可夫场,有
·“全局马尔可夫性”(Global Markov Property):给定两个变量子集的分离集,则这两个变量子集条件独立。
也就是说,图3中若令A,BC对应的变量集分别为xA,xBxCxA,xB和xC,则xAxBxA和xB在给定xCxC的条件下独立,记为xAxB|xCxA⊥xB|xC

图3 节点集AAB被节点集C分离

节点集A和B被节点集C分离

下面我们做一个简单的验证。为便于讨论,我们令图3中的A,BCA,B和C分别对应单变量xA,xBxCxA,xB和xC,于是图3简化为图4。

图4 图3的简化版

图3的简化版

对于图4,由式(2)可得联合概率

P(xA,xB,xC)=1ZψAC(xA,xC)ψBC(xB,xC)4P(xA,xB,xC)=1ZψAC(xA,xC)ψBC(xB,xC)(4)

基于条件概率的定义可得
P(xA,xB|xC)=P(xA,xB,xC)P(xC)=P(xA,xB,xC)xAxBP(xA,xB,xC)=1ZψAC(xA,xC)ψBC(xB,xC)xAxB1ZψAC(xA,xC)ψBC(xB,xC)=ψAC(xA,xC)xAψAC(xA,xC)ψBC(xB,xC)xBψBC(xB,xC)5(23)(24)(25)(23)P(xA,xB|xC)=P(xA,xB,xC)P(xC)=P(xA,xB,xC)∑xA′∑xB′P(xA′,xB′,xC)(24)=1ZψAC(xA,xC)ψBC(xB,xC)∑xA′∑xB′1ZψAC(xA′,xC)ψBC(xB′,xC)(25)=ψAC(xA,xC)∑xA′ψAC(xA′,xC)·ψBC(xB,xC)∑xB′ψBC(xB′,xC)(5)

P(xA|xC)=P(xA,xC)P(xC)=xBP(xA,xB,xC)xAxBP(xA,xB,xC)=xB1ZψAC(xA,xC)ψBC(xB,xC)xAxB1ZψAC(xA,xC)ψBC(xB,xC)=ψAC(xA,xC)xAψAC(xA,xC)6(128)(129)(130)(128)P(xA|xC)=P(xA,xC)P(xC)=∑xB′P(xA,xB′,xC)∑xA′∑xB′P(xA′,xB′,xC)(129)=∑xB′1ZψAC(xA,xC)ψBC(xB′,xC)∑xA′∑xB′1ZψAC(xA′,xC)ψBC(xB′,xC)(130)=ψAC(xA,xC)∑xA′ψAC(xA′,xC)(6)

由式(5)和式(6)可知
P(xA,xB|xC)=P(xA|xC)P(xB|xC)7P(xA,xB|xC)=P(xA|xC)P(xB|xC)(7)

xAxAxBxB在给定xCxC时条件独立。
由全局马尔可夫得到两个很有用的推论:

(1)局部马尔可夫性(Local Markov Property):给定某个变量的邻接变量,则该变量条件独立于其他变量,形式化地说,令VV为图的节点集,n(v)为节点vv上的邻接节点,n(v)=n(v){v},有xvxV\n(x)|xn(v)xv⊥xV\n∗(x)|xn(v)
(2)成对马尔可夫性(Pairwise Markov P roperty):给定所有其它变量,两个非邻接变量条件独立。形式化地说,令图的节点集和边集分别为VVE,对图中的两个节点uuv,若u,vE⟨u,v⟩∉E,则xuxv|xVu,vxu⊥xv|xV∖⟨u,v⟩

现在我们来考察马尔可夫随机场中的势函数。显然,势函数ψQ(xQ)ψQ(xQ)的作用是定量刻画变量集xQxQ中变量之间的相关关系,它应该是非负函数,且在所偏好的变量取值上有较大函数值。例如,假定图4中的变量均为二值变量,若势函数为

ψAC(xA,xC)={1.5,0.1,if xA=xC;otherwise.ψAC(xA,xC)={1.5,if xA=xC;0.1,otherwise.

ψBC(xB,xC)={0.2,1.3,ifxB=xC;otherwise.ψBC(xB,xC)={0.2,ifxB=xC;1.3,otherwise.

则说明该模型偏好变量xAxAxCxC拥有相同的取值,xBxBxCxC拥有不同的取值;换言之,在该模型中xAxAxCxC正相关,xBxBxCxC负相关。结合式(2)易知,令xAxAxCxC相同且xBxBxCxC不同的变量值指派将取得较高的联合概率。

为了满足非负性,指数函数常被用于定义势函数,即

ψQ(xQ)=eHQ(xQ)8ψQ(xQ)=e−HQ(xQ)(8)

HQ(xQ)HQ(xQ)是一个定义在变量xQxQ上的实值函数,常见形式为
HQ(xQ)=u,vQ,uvαuvxuxv+vQβvxv,9HQ(xQ)=∑u,v∈Q,u≠vαuvxuxv+∑v∈Qβvxv,(9)

其中αuvαuvβvβv是参数。上式中的第二项仅考虑单节点,第一项则考虑每一对节点的关系。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值