MOOC-浙江大学-博弈论基础-学习笔记(九)

本文是关于浙江大学MOOC博弈论基础的学习笔记,重点探讨混合策略和监督博弈。介绍了混合策略的概念,包括纯策略与混合策略的对比,并通过随机药物检测、点球射门等例子进行说明。此外,分析了智猪博弈和懦夫博弈中的混合策略应用,以及雇主与雇员的监督博弈模型,揭示了不同参数对均衡的影响。最后强调在难以监督的职业中职业道德的重要性。

第六讲 混合策略与监督博弈

对应书中的第十三章 混合策略、第十四章 监督博弈

目录

  • 第一节 概念及说明(混合策略)
  • 第二节 扩展分析 (混合策略)
  • 第三节 雇主与雇员的监督博弈
第一节 概念及说明(混合策略)

1.纯策略&混合策略
纯策略:如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动。
混合策略:如果一个策略要求参与者在给定信息情况下以某种概率分布随机地选择不同的行动。

2.示例
①随机药物检测,可能被抽检,也可能不被抽检。
在这里插入图片描述
②点球射门
攻方的策略有:左边、右边
守方的策略有:左边、右边
在这里插入图片描述
③假设我和你一起玩“石头、剪刀、布”的游戏,如果我告诉你说,我准备出“石头”,请问:你会出什么?
第一次赌注为10元。
第二次赌注为10万元。

特别提示:小得失相信人,大得失怀疑人!
游戏玩久了,赚钱就难了。(红海&蓝海)

ps:混合策略,更贴近现实。特别是对没有把握,和没有太大把握的人、事。
在处事时,对把握不准的地方,要准备多种解决方案。

第二节 扩展分析 (混合策略)

1.智猪博弈中的混合策略

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值