斯坦福-随机图模型-week4.0_

本文介绍了如何利用随机图模型进行决策,包括所需元素如决策情景、行为选项、状态变量及收益函数,并通过具体案例展示了期望收益最大化的策略选择过程。

title: 斯坦福-随机图模型-week4.0
tags: note
notebook: 6- 英文课程-9-Probabilistic Graphical Models 1: Representation
---

斯坦福-随机图模型-week4.0

最大期望收入模型

简答的决策

我们使用随机图模型进行决策需要的原料是什么ne ?

  • 我们需要决策的情景img_2661c2f73236ce62700299f2115fb4d9.gif
  • 一些列的可能的行为img_e6286d0e68f1f2045bf507a0dffeff95.gif
  • 一系列的转台量:img_080a967a046357289d6928c2947e418f.gif
  • 还有一个收益函数

期望的收益公式:

img_b97b1e45292f836c401c8e8aad41aa4f.png

期望收益公式表示是这样的,每个行为的可能性,乘以他的期望收益的加权和。

描述你这一系列的行为的期望的收益。

我们的目标就变成了,选择一系列的行为从而让自己的收益变成最大。

img_fbfa1c17aa2f20ed774eae93b0825d75.png

influence diagram 影响图

img_8ea3c0d487ea8af2026f976ef199566f.png

考虑这样的一个商业的模型,市场的情况分成三种,m1m2m3,你的行为可以分成两种,进入市场和不进入市场。那么整个的收益情况就可以用右下的哪个表格描述。

那么要怎样选择一个优秀的策略呢,就是按照我们刚刚介绍的方法,将收益最大化。

我们还可以介绍一个更加复杂的影像图。

img_034e130365df2f61d6f1ab7e56bb9bae.png

这个影像图描述了成绩,学习,等因素的关系。

有信息情况下的期望收益

img_e6d96b97ed473d523e42292264d9fda4.png

好了,就介绍到这里,后面的内容请大家参考博弈论的相关内容提供我们博弈论笔记

http://www.cnblogs.com/zangzelin/p/8563028.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值