16、决策中的贝叶斯网络扩展与影响图求解

决策中的贝叶斯网络扩展与影响图求解

在决策分析领域,我们常常会面临如何根据已知信息做出最优决策的问题。传统的决策树方法虽然具有一定的灵活性,但在处理复杂的决策序列时会面临诸多挑战。为了解决这些问题,影响图作为一种扩展的贝叶斯网络应运而生。

决策树的局限性

在考虑是否举办派对的问题中,决策树(DT)的应用存在一些特点。当决定举办派对时, I [Party = no] 这一条件会限制决策树的展开。在回答是否举办派对的问题时,我们会选择与最大期望效用相对应的派对状态。

在分析决策树时,我们通常从最后一个决策步骤开始,例如“访问”(Visit)阶段。在这个阶段,我们假设之前已经对派对的举办与否做出了决策,并且观察到了是否下雨的情况。然而,我们并不知道朋友是否在家,因此需要对这个未知因素进行平均计算以得到期望效用,然后通过最大化“访问”决策来确定最优选择。接着,我们再考虑倒数第二个决策,假设未来的决策都是最优的。由于未来的决策是在朋友状态不确定的情况下做出的,当前决策则需要在下雨情况不确定的条件下,通过最大化派对的期望最优效用来做出。

需要注意的是,最大化和求和的顺序非常重要,改变顺序通常会导致不同的问题和不同的期望效用。

对于“派对 - 朋友”的例子,决策树是不对称的。因为如果决定举办派对,就不会去拜访朋友,从而截断了决策树下半部分的进一步决策。虽然决策树方法具有灵活性,可以处理任意结构的决策问题,但它的一个缺点是相同的节点在决策树中经常重复出现。随着决策序列的增长,决策树的分支数量会随着决策数量呈指数级增长,使得这种表示方法变得不切实际。

影响图的引入

影响图是一种在贝叶斯

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值