博弈论的纳什平衡的两个例题

本文通过囚徒困境和美女游戏两个例子深入浅出地介绍了博弈论中的纳什平衡。在囚徒困境中,聪明的囚犯会选择招供,因为无论对方如何选择,招供都是更优策略。而在美女游戏中,最优策略是每8局出3次1,5次0,以达到收益最大化,美女在游戏中占据优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题1:囚徒困境。两个同伙案犯被抓住了。他们被分别关押起来,不能交流。每个人可以选择招供或者抵赖,如果两个人都抵赖,那么两个人都将判刑1年;如果两个人都招供,那么两人都判刑6年;如果一人招供一人抵赖,那么招供者无罪释放,抵赖者判刑10年。

有人说那简单啊两个人都抵赖不就好了吗?但是事实是多数情况下两个人都会选择招供。为什么呢?

我们列出表如下,其中表的两个数据表示两个人会判多少年。(收益是年,越大收益越高)

A/B 招供 抵赖
招供 -6,-6 0,-10
抵赖 -10,0 -1,-1

这里我们不论对A而言还是B而言(对称),我们都可以发现招供对于抵赖是严格优势的。如果我们是A,如果B选择招供,那么我选择招供会比抵赖收益更高(-6>-10);如果B选择抵赖,那么我选择招供还是会比抵赖收益更高(0>1);所以如果两个人够聪明的话,他们都会选择招供。

现在是下一个问题。现在美女来和你玩个游戏,两个人各说一个数字,只能说0或者1。如果两个人都说1,那么她会给你3元;如果两个人都说0,那么她会给你1元;其余情况你给她2元。那么这个游戏你玩不玩?不玩?你就单身去吧。真正的问题是,这个游戏公平吗?

先列个表。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值