18. 信息集合和子博弈完美
回顾一下我们之前介绍的博弈论,我们先介绍了同步决策,即当我做决策时并不知道你会做什么决策,参与者同时做出决策。之后又介绍了序贯博弈,即参与者按照顺序做出决策,且我做决策之前能够知道你将会有那些应对策略。
而今天我们介绍的博弈中则会包含这两种情况。
上图所示即为我们今天要介绍的一种博弈,它与之前唯一的不同在于中间出现了一条红色的虚线。现在我们引入“信息集合”的概念,即图中用虚线将上面两个2结点连在一起,表示参与者2在做决策的时候不清楚1选择的是u还是m,即虚线使得一些信息对于参与者来说是不清晰的,一些独立的决策变成了一些决策的集合。
上面图中的例子,参与者1会随机选择u或m(期望收益是2),而选择d的收益却是1。当把图中的虚线去掉,则由于参与者1根据逆向归纳法会选择d,因为若他选择u或者m,参与者2就会选择收益为(0, 4),这样参与者1的收益为0,所以他会选择d,收益为1。
定义:
参与者i的信息集合,是一系列参与者i无法识别的结点。
不允许的一些事情:
1. 同一个信息集合中的点处的选择策略集合是一样的;
2. 参与者1只要知道自己之前的选择,就知道自己现在处于的结点(完美的记忆力)。
完美信息:(每个人都记得之前的决策)
树图上所有信息集合包含一个节点的博弈(所有元素都是单元素)
另外一个例子,参与者1有两个选择,参与者2有三个选择,参与者2