在本人的 POJ 1740 解题报告中,已经提到这是一题有关博弈论的题目。现在,就让我们来一窥博弈论中的无偏博弈及其理论,并应用这些知识来解决几道 POJ 题目。本文定位于无偏博弈的入门介绍和其简单应用,因此,博弈定理的证明和详细讨论将被忽略。
一、什么是无偏博弈?
通俗地说,博弈就是“游戏”,而无偏博弈就是一种任意局势对参与游戏的两个选手来说都是平等的回合制游戏。因此,选手的区别只在于谁先进行第一个回合(即谁是先手)。按此定义,象棋、五子棋等都不是无偏博弈。这是因为,在这些棋类中,对于任意一个局势,有些棋子只能由某一选手移动;例如,在中国象棋中执红的选手在每一回合中只能操作红棋,而不能操作黑棋。
除了局势对选手平等之外,还有额外的三个要求:
(1)信息完全公开。这就是说,有关游戏的所有信息对所有选手都是可知的。因此,像扑克之类的游戏,通常都不是无偏博弈,因为,你看不到对手的牌,对手的也看不到你的。
(2)无随机性。一旦游戏完全设立好,每一人操作都是非随机的。这就排除了大富翁之类的游戏。
(3)有限步终止。游戏在有限步之内必然终止。这是一条很强的要求。例如,象棋之类的游戏就不满足这条要求。比如,当对手下感情棋时,游戏就可能无限进行下去。
说了这么多不是无偏博弈的游戏,现在举一个是的例子,而最经典的例子莫过于最简单的取石子游戏,也叫尼姆(Nim)博弈:有两堆石子,石子数目为 m > 0 和 n > 0。两个选手轮流从这些石堆中取走石子。在每一回合中,选手选定一个至少有一个石子的石堆,从该堆中取走至少一个石子。若某选手最后取走所有的石子,则该选手获胜,游戏宣告结束。
现在我们来验证这是一个无偏博弈。首先,任意局势对选手都是平等的。在任意回合中,如果一个操作或策略(取走x个石子)是被规则允许的(在这里,是 1<= x <= k),则无论该回合是由选手a或选手b进行,该回合的选手都可以采取该操作或策略。其次,信息完全公正。显然,选手采取的任何策略对于对手来说都是可见的。再次,无随机性。这个很显然。最后,有限步终止。因为每一回合中,至少有一个石子被取走,因此,石子的数目一直在减少。这样,最多 m+n 个回合之后,将没有石子留下,游戏结束。
二、有向无环图游戏
现在,设想一个有向无环图上(如无特别说明,本系列中的图都是指有向无环图)的棋子移动游戏:在一个有向无环图上,在某个顶点处有一颗棋子。在每一回合中,选手把该棋子沿某一出边移动到相邻的顶点上。当某选手最后移动棋子,从而使棋子处于一个没有出边的顶点上时,该选手获胜,游戏结束。
之所以介绍这个图上的游戏,是因为,任意一