贝叶斯网络(BN)的理解

本文介绍贝叶斯网络,它是用点表示事件条件概率、边表示事件依赖关系的有向无环图,实质是对联合概率的描述。阐述了联合、边缘、条件概率换算方法,还说明了网络构建的三个步骤,以及网络参数估计的最大似然估计和最大后验估计两种方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贝叶斯网络:用点表示事件的条件概率,用边表示事件依赖关系的有向无环图(DAG)

1.在贝叶斯往来中描述概率的方式是每个节点上的条件概率分布(CPD);

2.贝叶斯网络的实质是对联合概率的描述。

事件状态可枚举值二项分布or多项分布
连续变量连续变量离散化后进行多项式分布
在CPD中引入连续分布,如高斯分布N(\mu,\sigma)

以典型贝叶斯问题为例:天气影响小林与女朋友当晚是否会有电话、是否会见面;当晚见面与否会影响是否会有电话的概率;女友在建模或者电话中都有肯问小林要礼物;是否索要礼物不与天气直接产生关系,但实际通过另两个结点有间接关系。其中的CPD和DAG如下所示:

事件abcd皆为可枚举值,其中每个节点的状态只有两种,于是概率采用二项分布 。假设天气情况分为晴阴雨雪四种,见面分为不见面、校内见面、校外见面,那么可能见面事件为多项式分布,CPD如下所示:

条件a(天气)P(b=0)P(b=1)P(b=2)
0(晴)0.60.20.2
1(阴)0.20.30.5
2(雨)0.10.50.4
3(雪)0.30.70

假如礼物金额为连续变量,引入高斯分布:

条件b(见面)条件c(电话)P(d)
00N(\mu_{1},\sigma_{1})
01N(\mu_{2},\sigma_{2})
10N(\mu_{3},\sigma_{3})
11N(\mu_{4},\sigma_{4})

3.联合/边缘/条件概率换算

a.联合概率分布:P(a,b,c,...,n),其中a,b,c,...,n为系统中的所有变量;

b.边缘概率分布:边缘概率的表达方式与联合概率一样,区别是通过边缘概率查询概率时只需给出系统中的部分变量,比如:g(a,b),g(b,d,g,n),g(b)......;

c.条件概率分布:P(a,b|i=?,j=?)表示在已知某些变量(i,j)的的情况下求另一些变量(a,b)给定值的概率;

d.用联合分布求边缘分布:已知联合概率分布函数f(x,y,z),求边缘分布g(y)

              g(y)=\underset{-\infty}{\int\int} f(x,y,z)dxdy

对于离散变量,也就是

           g(y)=\sum_{z} \sum_{x}f(x,y,z)

e.用联合概率分布求条件概率分布

类似:根据小林与女友是否有过电话,问天气如何,

            P(x|y=?)=\frac{P(x,y=?)}{P(y=?)}

假设有电话为1,那么P(x|y=1)就是小林与女友有过电话,问天气如何。

f.用条件概率和边缘概率求联合概率分布:P(x,y)=P(x|y)P(y)

根据链式法则:P(a,b,c,d)=P(a)P(b|a)P(c|a,b)P(d|b,c)


 变量消元:


网络构建(三步):1.确定领域中有哪些是重要的变量以及其分布;

                                 2.确定DAG图结构;

                                 3.学习网络中每个节点CPD中的参数(即,监督学习中的参数估计)

网络参数估计:假设D为所有训练数据集,A为CPD参数

a.最大似然估计 (https://www.cnblogs.com/sylvanas2012/p/5058065.html

由贝叶斯公式P(A|D)=\frac{P(D|A)P(A)}{P(D)}可得似然度为式中的P(D|A),最大似然估计就是求如下目标中A的值:

                                                                             \underset{A}{argmax}P(D|A)

最大似然估计完全凭数据说话,没有办法加入任何人类的已有经验。

b.最大后验估计:把优化目标由似然度函数变为了后验函数,通过人为输入先验概率P(A)得到优化目标。

优化目标:(由于无论A取值如何都不影响P(D)的值,因此后两公式等价)

  \underset{A}{argmax}P(A|D)=\underset{A}{argmax}\frac{P(D|A)P(A)}{P(D)}=\underset{A}{argmax}P(D|A)P(A)

取对数得到:

\underset{A}{argmax}Pr(A|D)=\underset{A}{argmax} logPr(A|D)=\underset{A}{argmax} (logP(D|A)+logP(A))

两种参数估计都可以用数学推导或梯度下降的方法求解。

 

全概率分布可以回答相关领域的任何问题,但随着变量数目的增 加,全概率分布的联合取值空间却可能变得很大。另外,对所有的原 子事实给出概率,对用户来说也非常困难。 若使用Bayes 规则,就可以利用变量之间的条件独立关系简化计 算过程,大大降低所需要声明的条件概率的数目。我们可以用一个叫 作Bayesian 网的数据结构来表示变量之间的依赖关系,并为全概率分 布给出一个简明的表示。 定义(Bayesian 网):Bayesian 网T 是一个三元组(N,A,P),其 中 1. N 是节点集合 2. A 是有向弧集合,与N 组成有限非循环图G =(N,A) 3. P {p(V | ) :V N} v    ,其中 v  代表节点V 的父亲节点集合 Bayesian 网是一个有向非循环图: (1) 网中节点与知识领域的随机变量一一对应(下文中不区分节 点与变量); (2)网中的有向弧表示变量间的因果关系,从节点X 到节点Y 有 向弧的直观含义是X 对Y 有直接的因果影响;影响的强度或者说不确 定性由条件概率表示; (3)每个节点有一个条件概率表,定量描述其所有父亲节点对于 该节点的作用效果。 -2- (4)由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 )由领域专家给定网络结构和条件概率表。 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 对领域专家来说,决定在特中存哪些条件独立联系通常是 较容易的 较容易的 较容易的 (给定网络结构相对容易 给定网络结构相对容易 给定网络结构相对容易 给定网络结构相对容易 给定网络结构相对容易 )─ 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 事实上,要远比际声明出这 些概率本身容易得多 些概率本身容易得多 些概率本身容易得多 些概率本身容易得多 些概率本身容易得多 (给定准确的条件概率相对 给定准确的条件概率相对 给定准确的条件概率相对 给定准确的条件概率相对 给定准确的条件概率相对 给定准确的条件概率相对 困难) 。一旦 。一旦 。一旦 BayesianBayesianBayesianBayesianBayesian Bayesian网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网的拓扑结构给定, 则只需对那些直接相互依赖节点出条件概率网
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值