Yale开放课程博弈论15

本文介绍了策梅洛定理,揭示了在完全信息博弈中先行者或后行者必有一方有必胜/必不败的策略。通过实例分析了井字过三关、西洋跳棋、国际象棋等游戏的结果,并探讨了石子阵列博弈的解。同时,阐述了逆向归纳法在解决博弈策略中的应用,以市场垄断者与新进入者之间的博弈为例,讨论了可信威胁的重要性。

15. 落后的感应------国际象棋、战略和可信的威胁

 

通过上节课最后的小游戏尼姆博弈(Nim Game)来承上启下。这个游戏的结论是当两堆石子数目一致时,后行者每次选择与先行者对称的策略(先行者选择A堆的x个,后行者就选择B堆的x个)来取胜。当两堆石子数目不一致时,先行者选择较多的那堆石子将两堆数目变得一致,即先行优势可以在自己进行一轮后将局势转换成后行优势。

 

这里要介绍策梅洛(Zermelo)定理,假设为完全信息博弈(知道之前的决策)、有限结点、博弈结果有三种可能,那么先行或后行者当一必有一方有必胜/必不败的策略。

 

有了这个定理,我们就可以知道譬如井字过三关(tic-tac-toe)平局博弈、西洋跳棋、国际象棋等博弈都会有结果。

 

而策梅洛定理可以采用归纳法证明,归纳的对象是博弈的最大长度N(也可以看成博弈树的高度)。

 

首先证明对长度为1时的博弈成立,然后假设长度小于等于N的博弈成立,推出博弈为N+1的博弈也成立。

在后一步的推导过程中我们定义了子博弈问题(subGame),例如在长度为N的博弈中第一个节点处一号参与者选择向上或者向下走之后的子树对应一个子博弈问题,其长度为N-1。

我们首先假设所有长度为N或者更小的博弈都有解,我们指出所有长度为N+1的博弈都可看作是一号参与者走了整个博弈的第一步之后的长度为N或者更小的子博弈。每个长度为N或者更小的步数的博弈都有解,那么一号参与者只需要早这里选择一个对他来说更优的子博弈,我们的证明就结束了。

 

玩游戏

石子阵列,N行M列(如5行3列,4行5列)

参与人按顺序博弈,当轮到你时,选择一颗石子,然后它东北方向(右上角包括自己)所有的石子都被拿走,谁拿走最后一颗石子,谁输。

根据策梅洛定理,无论N和M取值如何,这个游戏都有解。而homework就是找出这个解。

提示:记住有解是很有意义的。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值