博弈论

一.博奕论(Wythoff Game)

     有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。两个人轮流从堆中取物体若干,规定最后取光物体者取胜。这是我国民间很古老的一个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。下面我们来分析一下要如何才能够取胜。

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。

显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=m+1r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。

这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。

(二)威佐夫博奕(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

这种情况下是颇为复杂的。我们用(akbk)(ak ≤ bk ,k=012...,n)表示两堆物品的数量并称其为局势,如果甲面对(00),那么甲已经输了,这种局势我们称为奇异局势。前几个奇异局势是:(00)、(12)、(35)、(47)、(610)、(813)、(915)、(1118)、(1220)。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数, bk= ak + k,奇异局势有如下三条性质:

1、任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质1。成立。

2、任意操作都可将奇异局势变为非奇异局势。

事实上,若只改变奇异局势(akbk)的某一个分量,那么另一个分量不可能在其他奇异局势中,所以必然是非奇异局势。如果使(akbk)的两个分量同时减少,则由于其差不变,且不可能是其他奇异局势的差,因此也是非奇异局势。

3、采用适当的方法,可以将非奇异局势变为奇异局势。

假设面对的局势是(a,b),若 b = a,则同时从两堆中取走 a 个物体,就变为了奇异局势(00);如果a = ak b > bk,那么,取走b - bk个物体,即变为奇异局势;如果 a = ak  b < bk ,则同时从两堆中拿走 ak - ab - ak个物体,变为奇异局势( ab - ak , ab - ak+ b - ak);如果a > ak b= ak + k,则从第一堆中拿走多余的数量a - ak 即可;如果a < ak b= ak + k,分两种情况,第一种,a=aj j < k,从第二堆里面拿走 b - bj 即可;第二种,a=bj j < k,从第二堆里面拿走 b - aj 即可。

从如上性质可知,两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜;反之,则后拿者取胜。那么任给一个局势(ab),怎样判断它是不是奇异局势呢?我们有如下公式:

ak =[k1+√5/2]bk= ak + k k=012...,n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数(1+√5/2 = 1.618...,因此,akbk组成的矩形近似为黄金矩形,由于2/1+√5=√5-1/2,可以先求出j=[a√5-1/2],若a=[j1+√5/2],那么a = ajbj = aj + j,若不等于,那么a = aj+1bj+1 = aj+1+ j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异局势。 

(三)尼姆博奕(Nimm Game):有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

这种情况最有意思,它与二进制有密切关系,我们用(abc)表示某种局势,首先(000)显然是奇异局势,无论谁面对奇异局势,都必然失败。第二种奇异局势是(0nn),只要与对手拿走一样多的物品,最后都将导致(000)。仔细分析一下,(123)也是奇异局势,无论对手如何拿,接下来都可以变为(0nn)的情形。

计算机算法里面有一种叫做按位模2加,也叫做异或的运算,我们用符号(+)表示这种运算。这种运算和一般加法不同的一点是1+1=0。先看(123)的按位模2加的结果。

1 =二进制01

2 =二进制10

3 =二进制11 +

———————

0 =二进制00 (注意不进位)

对于奇异局势(0nn)也一样,结果也是0

任何奇异局势(abc)都有a+b+c =0

如果我们面对的是一个非奇异局势(abc),要如何变为奇异局势呢?假设 a < b< c,我们只要将 c 变为 a+b,即可,因为有如下的运算结果: a+b+(a+b)=(a+a)+(b+b)=0+0=0。要将变为a+b,只要从 c中减去 c-a+b)即可。

1:(142139),14+21=2739-27=12,所以从39中拿走12个物体即可达到奇异局势(142127)。

2:(5581121),55+81=102121-102=19,所以从121中拿走19个物品就形成了奇异局势(5581102)。

3:(294558),29+45=4858-48=10,从58中拿走10个,变为(294548)。

4:我们来实际进行一盘比赛看看:

      :(7,8,9)->(1,8,9)奇异局势

      :(1,8,9)->(1,8,4)

      :(1,8,4)->(1,5,4)奇异局势

      :(1,5,4)->(1,4,4)

      :(1,4,4)->(0,4,4)奇异局势

      :(0,4,4)->(0,4,2)

      :(0.4,2)->(0,2,2)奇异局势

      :(0,2,2)->(0,2,1)

      :(0,2,1)->(0,1,1)奇异局势

      :(0,1,1)->(0,1,0)

      :(0,1,0)->(0,0,0)奇异局势

      甲胜。

对于本次普及组“取石子游戏”来说,

19  010011

7  000111

5       000101

3       000011

         010010   (18)10

501832

所以第1次只能在第5堆石子中取32粒,使得取出32粒后为奇异局势,即异或运算结果为0

2

详细的证明过程

方法一

简单分析一下,容易知道两堆石头地位是一样的,我们用余下的石子数(a,b)来表示状态,并画在平面直角坐标系上。

用之前的定理: 中所述的方法寻找必败态。先标出(0,0),然后划去所有(0,k),(k,0),(k,k)的格点;然后找y=x上方未被划去的格点,标出(1,2),然后划去(1,k),(k,2),(1+k,2+k),同时标出对称点(2,1),划去(2,k),(1,k),(2+k,1+k);然后在未被划去的点中在y=x上方再找出(3,5)。。。按照这样的方法做下去,如果只列出a<=b的必败态的话,前面的一些是(0,0),(1,2),(3,5),(4,7),(6,10),…

接下来就是找规律的过程了,可能很辛苦,但是我写得也不容易,而且我暂时没有看到其他地方有这样的证明过程。

忽略(0,0),记第n组必败态为(a[n],b[n])

命题一:a[n+1]=前n组必败态中未出现过的最小正整数

[分析]:如果a[n+1]不是未出现的数中最小的,那么可以从a[n+1]的状态走到一个使a[n+1]更小的状态,和我们的寻找方法矛盾。

命题二:b[n]=a[n]+n

[分析]:归纳法:若前k个必败态分别为(ak,ak+k),下证:第k+1个必败态为(ak+1,ak+1+k+1)

从该第k+1个必败态出发,一共可能走向三类状态,从左边堆拿走一些,从右边堆拿走一些,或者从两堆中拿走一些.下面证明这三类都是胜态.

情况一:由命题一,任意一个比a[k+1]小的数都在之前的必败态中出现过,一旦把左边堆拿少了,我们只要再拿成那个数相应的必败态即可。

情况二(从右边堆拿走不太多):这使得两堆之间的差变小了,比如拿成了(ak+1,ak+1+m),则可再拿成(am,am+m);

情况二(从右边堆拿走很多):使得右边一堆比左边一堆更少,这时类似于情况一,比如拿成了(ak+1,am)(其中a[m]

情况三:比如拿成(am,am+k+1),则可再拿成(am,am+m).

综上所述,任何从(ak+1,ak+1+k+1)出发走向的状态都可以走回核中.故原命题成立.

以上两个命题对于确定(a[n],b[n])是完备的了,给定(0,0)然后按照这两个命题,就可以写出(1,2),(3,5),(4,7),…

这样我们得到了这个数列的递推式,以下我们把这两个命题当成是(a[n],b[n])的定义。

先证明两个性质:

性质一:核中的a[n],b[n]遍历所有正整数。

[分析]:由命题一,二可得a[n],b[n]是递增的,且由a[n]的定义显然。

性质二:A={a[n]:n=1,2,3,…},B={b[n]:n=1,2,3,…},则集合A,B不交。

[分析]:由核是内固集,显然。

看到这里大家有没有想到Beatty序列呢,实际上a[n]和b[n]就是一个Beatty序列。

an=[αn],bn=[βn],有 an+n=[(α+1)n]=[βn],解方程 1/(α+1)+1/α=1

得 α=(sqrt5-1)/2,到此,我们找到了该必败态的通项公式。

实际上这组Beatty序列还有一些别的性质,比如当一个数是Fibonacci数的时候,另一个数也是Fibonacci数;而且两者的比值也越来越接近黄金比,这些性质在得到通项公式之后不难证明。

总的来说,这个问题给我们了哪些启示呢?首先用定理所说的方法找核,然后给出核的规律(递推,或是通项)并且证明。

方法二:

定理 0:一个状态是必败态,当且仅当它的所有后继状态都是必胜态;而一个状态是必胜态,只要它的后继状态有一个以上的必败态即可。

证明略去。

容易发现下面的定理:

定理 1:(a,b) 和 (b, a) 的胜负性是相同的(a <> b)。

证明:如果 (a, b) 是必胜态,那么将必胜策略中所有的操作,对第一堆的变为第二堆,对第二堆的变为第一堆,就构成 (b, a) 的必胜策略

定理 2:若 (a, b) 是必败态,则对于所有的 x <> a 和 y <> b,(x, b) 和 (a, y) 是必胜态。

证明:

对于 x > a 和 y > b,不管是哪一种情况,总可以从 x 堆或 y 堆中取出一定量的石子使当前状态变为必败态 (a, b),由定理 1,(x, b) 和 (a, y) 为必胜态。

对于 x < a 和 y < b,不管是哪一种情况,如果 (x, b) 或 (a, y) 是必败态的话,由上述可得 (a, b) 是必胜态,矛盾。故 (x, b) 和 (a, y) 均为为必胜态。

定理 3: 若 (a, b) 是必败态,则对于所有的 d > 0,(a + d, b + d) 是必胜态。

证明:

与定理 2 类似。

定理 4:在所有的必败态中,每个数字恰巧出现一次。

证明:

有了定理 1,对于对称的状态我们只需要处理其中一个,而两个数不会相同(相同的状态必然是必胜态),于是我们把每个状态中较小的数字放在前面,每行写一个状态,去掉括号并按照升序排列每行的第一个数,就构成了如下的矩阵:

1 2

3 5

4 7

6 10

……

假设数字k在矩阵中出现两次或两次以上,则有(k,a),(k,b)都为必败态,与定理2矛盾。

假设数字k为序列中没有出现且值最小的数字,则有 (k,k+i)为必胜态(i>0),则对任意i,必然存在j(0

根据鸽巢原理,必然存在3个i的取值(其实是无穷多个,j只有k-1种取值,而i有无数种)记为i, i, i使得j=j=j=m。对这3个i,同样必然存在一对i,不妨为(i,i),使(k-m,k+i-m)且(k-m,k+i-m)必败或f(k-m,k+i)且f(k-m,k+i)必败。显然与定理2矛盾,因此不存在这样的数k。

观察这个矩阵,我们又可以得到新的定理:

定理 5:矩阵中每行第一个数恰巧是前面每一行中没有出现过的最小正整数。

证明:

由定理 4,矩阵中每个数字恰巧出现一次,而按照这个矩阵的定义,第二列的数总比同行第一列大,第一列又按照升序排列,所以每一行的第一个数正好为前面每一行中没有出现过的最小正整数。

定理 6:矩阵第 i 行的第二个数正好为第一个数加上 i

证明:

用数学归纳法。

1) 对于第一行显然成立

2) 若对于前 i - 1 行均成立,则所有的 (a[p], a[p] + p) (a[p] 为第 p 行第一个数,p < i) 均为必败态,那么考察第 i 行的状态 (a[i], a[i] + delta)。容易看出 delta >= i,因为如果 delta < i,一定可以通过一次操作变为前面出现过的必败态,那么这个状态就是必胜态。下面由 delta >= i,我们来说明 delta = i。

首先,我们考虑从第一堆中取出 p 个石子,得到状态 (a[i] - p, a[i] - p + delta),由定理 5,比 a[i] 小的数都在之前出现过,若 a[i] - p 出现在某一行的第一列,由于存在必败态 (a[i] - p, a[i] - p + d) (d < delta),故 (a[i] - p, a[i] - p + delta) 一定为必胜态(定理 2);若 a[i] - p 出现在某一行的第二列,由于第一列是单增的,因而其对应的第一列数必小于 a[i] + delta,故而也可推出其状态为必胜态。

对于从两堆石子中取出相同数目的情况与之类似,容易看出一定为必胜态。

于是,(a[i], a[i] + delta) 状态的胜负性只与状态 (a[i], a[i] + d) (d < delta) 有关。不难看出,delta = i 时恰为必败态,因为不论从第二堆中取出多少个石子,作为另一堆的第一堆石子并没有在之前出现过,所以得到的一定是一个必胜态,因而 (a[i], a[i] + delta) 为必败态,由定理 2 及定理 4 可得,原命题成立。即矩阵中第 i 行第二列的数等于同行第一列的数加上 i。

这时,我们所有的问题都转化到了矩阵上,只要能通过合适的方法表示出这个矩阵,我们就可以很好地解决原问题。

结论:

两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜;反之,则后拿者取胜。

那么任给一个局势(a,b),怎样判断它是不是奇异局势呢?我们有如下公式:

ak =[k(1+√5)/2],bk= ak + k (k=0,1,2,...n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数(1+√5)/2 = 1.618...因此,由ak,bk组成的矩形近似为黄金矩形,由于2/(1+√5)=(√5-1)/2,可以先求出j=[a(√5-1)/2],若a=[j(1+√5)/2],那么a = aj,bj = aj + j,若不等于,那么a = aj+1,b = aj + j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异局势。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值