1.博弈的收益矩阵
两个人博弈可以用收益矩阵来衡量:
厂商B | |||
合作 | 不合作 | ||
厂商A | 合作 | 10,5 | 15,0 |
不合作 | 6,8 | 10,2 |
表1 收益矩阵1
此矩阵叫做收益矩阵
2.占优策略
占优策略均衡是指博弈中一个人的最优策略不依赖于其他人的策略选择,不论其他人选择什么策略,他的最优选择是唯一的。比如表1中的例子,厂商A选择合作时,厂商B不合作,获得收益15,厂商B合作获得收益10,而A选择不合作时,厂商B选择合作获得收益6,不合作获得收益10,选择合作获得的收益在任何情况下都大于不合作的情形,那么合作就是厂商A的占优策略。
3.纳什均衡
纳什均衡是这样的策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。如表1中,同样可以分析得出厂商B的占优策略是合作,因此纳什均衡为(合作,合作)。
4.混合策略
粥店1 | |||
甜粥 | 咸粥 | ||
粥店2 | 甜粥 | -1,-1 | 2,2 |
咸粥 | 2,2 | -1,-1 |
表2 混合策略
在表2中有这样一个收益矩阵,从表上看,纯策略的纳什均衡为(甜粥,咸粥)或者(甜粥,咸粥)。混合策略纳什均衡:假设粥店1以p选择甜粥,(1-p)选择咸粥,同样,粥店2以q选择甜粥,(1-q)选择咸粥。
粥店1的期望支付为所有情形发生的概率以及其收益的乘积,同理可以计算粥店2的,两方均取得最大收益的时候,可以解得:粥店1选择混合策略(0.5,0.5),粥店2选择混合策略(0.5,0.5),博弈达到了均衡。
5.囚徒困境
李四 | |||
坦白 | 抵赖 | ||
张三 | 坦白 | -15,.-15 | 0,-20 |
抵赖 | -20,0 | -1,-1 |
表3 囚徒困境
表3中有这样一个博弈,张三和李四被警察抓住了,警察没有证据证明他们干了什么事情,需要他们选择坦白或者抵赖。对于张三来说,他的占优策略是坦白,对于李四来说同理,但是如果两人都选择不坦白,则都可以获得最好的结局。
囚徒困境反映了一个矛盾,即个体理性和团体理性的冲突。
6.重复博弈
参与人仅相遇一次,所以他们只进行一次博弈,如果要进行多轮叫做重复博弈。
景区售卖劣质产品,而且价格奇高。他们遵循的是单次博弈的方法,他们可以笃定,这次捞了一大笔钱之后,不再进行二次博弈,因为如果二次博弈,消费者必然不会再购买,第二次收益为负。但对于一个大的品牌企业来说,为了挽留住客户,他们会树立起自己的口碑,与消费者进行重复博弈,双方互赢,才能长久。
7.序贯博弈
一个人先采取行动,另一个人后采取行动,叫做序贯博弈。
比如垄断行业中,企业A选择进入或者不进入,然后企业B选择阻止或者不阻止。
绑架行为是非常严重的违法行为,将会严重损害被绑架者的利益。当政府宣布,对于绑架行为,不进行谈判,直接击毙。这种带有威胁性的发言是否有效呢?当绑架者实行绑架行为的时候,事态就已经发生了,此时,只有两种选择,要么击毙劫匪,但人质也会丧命,这是最差的情况。要么选择和劫匪谈判,或许还有些许机会。所以此时选择谈判为明智之举。