博弈论-第一章 概述

博弈论是研究决策者如何在互动环境中选择策略的理论。文章介绍了博弈的基本概念,如何定义博弈、参与者、信息和策略,并通过简单的数字游戏解释了博弈的互动性和策略选择的重要性。同时,讨论了不同类型的博弈,如合作与非合作、静态与动态、完全信息与不完全信息博弈。文中举例展示了罗森塞蜈蚣博弈和数字游戏,阐述了选择正确策略和市场的重要性,以及学习博弈论的潜在收益。

1.何为博弈:

博:博览全局。

弈:对弈棋局。

博弈:指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。

1)首先确定谁是博弈的对手和未来的对手

2)博弈中既存在竞争关系,也存在合作关系



2.一个简单的数字游戏:

各位同学写1个介于1与100之间的自然数(整数,包括1与100)在内,然后求出所有数字的平均数,如果你写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。

一般来说,能够获胜的数字取决于平均数,平均数取决于其他人写的数字,于是你就会猜测其他人写了什么数字。如果平均数是50,那么能够获胜的数字是25,如果其他人都想到了这一层,写25,那么平均数就是25,能够获胜的数字是12,如果其他人也想到了这一层……推到极致,能够获胜的数字就是1,但其实大多数人并不会想这么多层,所以其实1获胜的概率是很低的,能够获胜的数字在区间[12,25]的可能性比较大。同时,也可能存在一些不想获胜,故意捣乱的人,会写50以上的数字。

博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。


3.罗森塞蜈蚣博弈

两人分钱袋子里的钱。
  一开始钱袋子里的钱有50,A的回合,A可以选择直接分钱或继续参与。如果直接分钱,A获得40,B获得10;如果继续游戏,则钱袋子里的钱翻倍。
  此时钱袋子里的钱有100,B的回合,B选择直接分钱则A获得20,B获得80;B选择继续游戏则钱袋子里的钱翻倍。
  此时钱袋子里的钱有200,A的回合,A选择直接分钱则A获得160,B获得40;A选择继续游戏则钱袋子里的钱翻倍。
  此时钱袋子里的钱有400,B的回合,B选择直接分钱则A获得80,B获得320;B选择继续游戏则钱袋子里的钱翻倍。
  此时钱袋子里的钱有800,这是最后的回合,A获得640,B获得160。

在这里插入图片描述
  可以看出,在自己的回合中,如果选择直接分钱,自己获得的钱是对方的四倍(以第一轮为例,A获得40,B获得10),如果选择继续游戏,下一轮对方选择结束,则自己获得的钱变为原来的一半(从40变为20),而和在本轮结束相比(在第一轮结束B获得10),对方可以获得八倍报酬(B在第二轮结束可获得80)。

所以其实是要猜测对方在自己的回合中,是选择放弃高报酬让总金额变大,还是会选择结束游戏获得目前金额中的大部分。当然,越往后对方选择结束游戏的可能性越高。

以终为始,第五轮游戏结束,A可以分更多的钱,所以可以猜测,如果到了第四轮,B肯定会结束游戏,而如果A预测到这一点,则A肯定会在第三轮结束游戏,所以B很可能会在第二轮选择结束……

在对方选择结束前结束,是利益最大化的。而对方结束是因为对方认为我会结束,想让对方继续就得让对方认为我会继续。自己看起来越傻(博傻),对方就越愿意跟我们合作,适当的让利,不要看起来太精明。



4.又一个简单的数字游戏

每位同学写5个大于0的自然数,如果你写数字中有一个是所有同学所写的数字中最小的(且没有重合),那么你将在该游戏中胜出。

假设一共有100人参加游戏 ,那么有5 x 100=500个数字,如果从1开始每一个数字都至少有一个重复,那么不重复的数字从251开始。但事实上这样的概率是非常低的,用计算机进行模拟,数字区间[1,100],每一个数字的都有重复的概率也是非常低的。

1几乎百分百会重复,10以下数字不重复的概率也几乎为零。[20,40]之间是最有可能的,同时写奇数的远比偶数要多,因此偶数胜出的可能性要大得多。在老师经历中10次游戏有8次是偶数,2次是奇数。

如果多次进行游戏,数字的分布会越来越分散。
  

  

5.选对市场(对手)比选对策略更重要

《说谎者的扑克牌》一书中写道:“那些掌握最充分信息的股票市场经纪人和分析师在市场上选股的成绩,并不比猴子从帽子里抓个名字或把《华尔街日报》钉在墙上向股票投掷飞镖的择股法来得更好!”

在充分竞争的市场里,很难获得平均以上的利润。(不要在一个充分竞争的市场去追求成功,进入门槛越低的市场,竞争越充分)

在博弈之前,博弈就已经开始了。

6.学习博弈论的收益

1)当局者清:更有利的选择,更快速的反应

2)旁观者更清:理解历史与现实,预测未来的发展

3)可以提出更好的游戏规则

7.一些模型

1)古诺模型

参加博弈的双方以各自在同一时间相互独立的产量作为决策的变量,是一个产量竞争的模型。

2)伯川德模型

该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过指定一个最优的销售价格来实现利润最大化。(价格战)

3)斯塔克尔伯格模型

该模型分析的是这么一种竞争:企业A先决定一个产量,然后企业B可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。



8.术语解释

1)参与人(players):理性选择的主体。

2)信息(information):参与者有关博弈的知识。

3)行动(action):参与者能够选择的变量。

4)策略(strategies):参与者在行动之前所准备好的一套完整的行动方案(预案)。策略让我们建立起了从信息到行动的快速反应机制,从而能够以最快的速度做出行动选择。

-完整性 -多样性 -不可观察性

三十六计中的某一计是行动,什么情况用哪一计是策略。

5)损益(payoff):参与者的得与失。

6)结果(outcome):所有参与者选择各自策略的后果。

7)均衡(equilibrium):所有参与者的最优策略组合。

8)博弈的规则(rules of the game):参与者、行动和结果合起来称为博弈的规则。

9)博弈论(game theory):是一种研究人们怎么做策略(行动)选择及其最后的均衡结果会是什么的理论。

9.博弈的分类

1)合作博弈和非合作博弈

合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。

非合作博弈:指参与者无法达成这样一种协议。

2)静态博弈和动态博弈

静态博弈:指在博弈中,参与者同时选择,或虽非同时选择,但是在逻辑时间上是同时的。

动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。

3)完全信息博弈与不完全信息博弈

完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。

不完全信息博弈:总有一些信息不是所有参与者都知道的。(信息不对称)

完全信息静态博弈:纳什均衡-纳什(本课重点)

完全信息动态博弈:子博弈精炼纳什均衡-泽尔腾

不完全信息静态博弈:贝叶斯纳什均衡-海萨尼

不完全信息动态博弈:精炼贝叶斯纳什均衡-泽尔腾

4)零和博弈和非零和博弈

零和博弈:指博弈前的损益总和与博弈后的损益总和相等。

非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负和)

不玩负和游戏,少玩零和游戏,多玩正和游戏。





本文是该博弈论课程的学习笔记,包含课程内容和部分个人见解:
【浙大|耶鲁】博弈论(合61讲)蒋文华 本·波拉克(Ben Polak)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值