【博弈论】混合策略纳什均衡

文章探讨了在博弈论中的混合策略,以盖硬币博弈为例,解释了如何通过混合策略找到纳什均衡,以及如何计算混合策略的收益和反应函数。通过Python代码展示了反应函数的绘制,强调了反应函数交点与纳什均衡的关系。

上一章中遇到了划线法无法找到均衡的情况,例如盖硬币博弈,盖方盖硬币,猜方猜正反。那是因为考虑的都是纯策略,就是每个策略要么选,要么不选。本章考虑混合策略,就是每个策略都有一个选择的概率。

考虑还是这个盖硬币的博弈,混合策略就是盖方以p的概率盖正,那么就是1-p的概率盖反,猜方同理。p是连续的取值,而如果退化成p只能取1或0,那就退化成原来的纯策略了。

一、寻找纳什均衡

策略B1 策略B2
策略A1 (2, 3) (5, 2)
策略A2 (3, 1) (1, 5)

考虑这样一个博弈,均衡就是,给定A的混合策略(p, 1-p),B的混合策略(q, 1-q),双方都不能改变自己的策略来使自己的收益增加。

换句话说,就是给定p,B的任何混合策略的期望都一样,给定q,A的任何混合策略的期望都一样。

这样计算E(B1(p))=E(B2(p))

               E(A1(q))=E(B2(q))

解出来就可以得到均衡。

3P+(1-p)=2p+5(1-p)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值