上一章中遇到了划线法无法找到均衡的情况,例如盖硬币博弈,盖方盖硬币,猜方猜正反。那是因为考虑的都是纯策略,就是每个策略要么选,要么不选。本章考虑混合策略,就是每个策略都有一个选择的概率。

考虑还是这个盖硬币的博弈,混合策略就是盖方以p的概率盖正,那么就是1-p的概率盖反,猜方同理。p是连续的取值,而如果退化成p只能取1或0,那就退化成原来的纯策略了。
一、寻找纳什均衡
| 策略B1 | 策略B2 | |
| 策略A1 | (2, 3) | (5, 2) |
| 策略A2 | (3, 1) | (1, 5) |
考虑这样一个博弈,均衡就是,给定A的混合策略(p, 1-p),B的混合策略(q, 1-q),双方都不能改变自己的策略来使自己的收益增加。
换句话说,就是给定p,B的任何混合策略的期望都一样,给定q,A的任何混合策略的期望都一样。
这样计算E(B1(p))=E(B2(p))
E(A1(q))=E(B2(q))
解出来就可以得到均衡。
3P+(1-p)=2p+5(1-p)

文章探讨了在博弈论中的混合策略,以盖硬币博弈为例,解释了如何通过混合策略找到纳什均衡,以及如何计算混合策略的收益和反应函数。通过Python代码展示了反应函数的绘制,强调了反应函数交点与纳什均衡的关系。
最低0.47元/天 解锁文章
664

被折叠的 条评论
为什么被折叠?



