海盗分金

本文探讨了博弈论的基本概念,包括纳什均衡,并通过海盗分金问题详细解析了纳什均衡的应用。展示了如何通过逆向思维找到最优策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

被面试官问到研究方向上的一些问题。其实是属于博弈论里比较基础和趣味性的问题。特此记录一下。

什么是博弈论

博弈论,英文名为game theory,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

纳什均衡

纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。

海盗分金

问题描述:
5个海盗抢到100个金币,他们决定这么分:

  1. 抽签决定自己的号码(1,2,3,4,5)
  2. 首先,由1号提出分配方案,然后大家5人进行表决,当半数以上的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
  3. 如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当半超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
  4. 依次类推…
    假设海盗都是理性人,问:第一个海盗提出怎样的分配方案才能够使自己的收益最大化。

问题解答:
问题的思路为从后往前推,即从第五名开始往前推。

  1. 对于5号,轮到他决策说明前四位海盗都被扔海里了,那么5号会选择独吞金币。即5号的决策为(100);
  2. 对于4号,如果不选择自己0金币,5号100金币,即(0,100),那么他就会被5号扔海里,5号独吞金币,所以4号最优决策是(0,100);
  3. 对于3号,剩下3个人,只要两票就会通过自己的决策,所以只需拉拢4号或者5号。对于5号,如果把3号扔海里,由4号或者自己决策利益最大,所以,5号难以拉拢。对于4号,如果不支持3号,那么接下来一个金币也得不到,所以3号决策只需给4号一个金币就能拉拢4号。即3号的最优决策为(99,1,0);
  4. 对于2号,剩下4个人,需要拉拢两个人才能通过自己的决策。2号会选择4号和5号,因为拉拢3号需要大于99的金币。拉拢4号和五号,只需给出的金币大于3号的就行,这样4号和5号不会将决策权交给3号。所以2号的最优决策为(97,0,2,1);
  5. 对于1号。只需要拉拢两个人就能通过自己的决策,拉拢2号代价太大。如果将决策权交给2号,3号将获得0个金币,所以给予3号1金币,3号将支持1号。对于4号和五号,需要给出多于2号给出的金币,才会支持1号。所以1号会选择5号拉拢,因为只需给2个金币,5号就会支持1号,而需要给3个金币,4号才会一定支持1号的决策。所以1号的最优决策为(97,0,1,0,2)。

理解过程形象成表:

序号12345
最优决策(97,0,1,0,2)(97,0,2,1)(99,1,0)(0,100)(100)
5号决策时收益----100
4号决策时收益---0100
3号决策时收益--9910
2号决策时收益-97021
1号决策时收益970102

模型思考:

  • 博弈论应用中的一个重要假设:所有参与人都是理性的。这个假设其实在实际中很难得到满足。
  • 先行者优势。1号利用时机上的优势,采取具有战略意义的行动而获得的优势。这也是安全博弈论中防御者的优势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值