博弈论

博弈论四大要素:

博弈参与者,博弈规则,博弈结局,博弈的效用。

博弈论两大假设:

一、认知理性

人是自我利益的判断者

偏好的完备性(completeness)(只有A>B,A<B,A~B三种情况)

偏好的传递性(transitivity)(A>B,B>C,则A>C)

中庸之道(综合激励)(若A~B,C=(A+B)/2,则C>A或B)

二、行为的理性

自我利益的追求者(行为者)

利益最大化(两利相权取其重,两害相权取其轻)

纳什均衡(Nash Equilibrium):

在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

博弈论四大基础分类:

决策需要信息,几乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。完全信息在这里指的是每个参与人对其他参与人的支付函数有着完全的了解。而静态指的是同时行动的博弈,或者不同时但后行动者不知道之前行动者的决策。分为四大类:完全信息静态博弈,不完全信息静态博弈,完全信息静态博弈,不完全信息动态博弈。

 

【囚徒困境】中基于收益矩阵的模型描述如下: 
这里写图片描述
【注】博弈中参与人只拥有有限个离散性的纯战略供其选择称为离散型策略。而在另外一些博弈中,每个参与者的纯策略可以是来自连续范围的一个数,如厂商定价,称为连续型策略。离散型策略静态博弈可以用支付表来表示,如上图。 
对于囚徒A与B来说,无论对方采取什么策略,自己的策略是“坦白”时总是比“抵赖”要好些,在两人无法通信的情况下,两人都会选择“坦白”。 
【优势战略均衡】在这里,无论对方选择什么,“坦白”的收益是严格大于“抵赖”,所以“坦白”是一个严格优势策略,对应的“抵赖”则是一个劣势策略。所有人都有自己的优势策略,由此产生的优势策略组合是一个优势战略均衡。 
但是这里需要注意的是,双方各自的优势策略却导致了集体的利益最差,如果两人都选择“抵赖”收益将是各自-1,但是优势策略下的收益却是-8.囚徒困境反映了个人理性与集体理性的冲突。个人的最优选择从社会角度看并不是最优的。社会生活中有很多例子:公共品的给予,商家的价格战,团队生产中的偷懒(三个和尚没水喝),小学生减负越减越重,各国军备竞赛等。 
【如何走出囚徒困境】如果有可信的承诺或者是惩罚(第三方实施),会使两人合作,促进集体利益最高。 
【智猪博弈】智猪博弈的收益矩阵模型如下: 
这里写图片描述 
在此处,小猪有优势与劣势策略,但大猪没有,只能根据小猪的策略做出最佳应对,而小猪不会选择劣势策略,因此剔除小猪“按”的策略,此时,大猪的策略只能为“等”。 

 

小游戏案例:

从1到100之间选数字,最后选择的数字接近平均数的三分之二的人获胜。

 

 

 

 

转载于:https://my.oschina.net/sunmin/blog/995677

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值