转自:
http://www.cnitblog.com/weiweibbs/articles/42736.html
http://blog.youkuaiyun.com/luomingjun12315/article/details/45555495
一、博弈
所要讨论的博弈模型的特点:
1、博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策,并且两人都使用最优策略来获取胜利。
2、博弈是有限的。即无论两人怎样决策,都会在有限步后决出胜负。
3、公平博弈。即两人进行决策所遵循的规则相同。
二、胜态与必败态
博弈是一个动态的过程,我们对每个要做决策的局面进行分析,分成胜态和必败态。必败态就是无论怎么决策都会失败的局面。(显然每种局面进行决策后局面态势会发生变化。)胜态与必败态有以下属性:
1、若面临末状态者为获胜则末状态为胜态,否则末状态为必败态。
2、一个局面是胜态的(N) <=> 该局面进行**某种**决策后会成为必败态。
3、一个局面是必败态(P) <=> 该局面**无论**进行何种决策均会成为胜态。
也就是说,胜点经过决策可能到达必败点,而必败点一定由胜点进入。
二、三种博弈模型
以下部分来自xm学长的资料。
1.简单的动态博弈
A 和 B 在玩硬币游戏。给定 k 个数字 a1,a2,...,ak 一开始有 x 枚硬币, A 和 B 轮流取硬币。每次取硬币的数量一定要在 a1,a2,...,ak A 先取, 取走最后一枚的一方获胜。当双方都采取最优策略时,谁会获胜?假定 a1,a2,...,ak 一定有 1
2.Bash博弈
一堆物体,规定每次取物的个数为 [1,m]
3.Wythoff博弈
两堆物体,规定取物者每次从某堆或同时从两堆中取同样多的物品,至少取一个。
判断方法:
ak ≤bk,
ak = ⌊ k∗(1 +√5)/ 2 ⌋,bk = ak +k(k = 0,1,2,...,n)
4.Nim博弈
n 堆物体,规定取物者每次从某堆中至少取一个。
判断方法:
必胜态:a1 XOR a2 XOR...XOR an ̸= 0
必败态:a1 XOR a2 XOR...XOR an = 0
三、SG函数
1.SG-组合游戏
2.游戏图
将组合游戏中的每一个状态抽象成图中的一个点,将每一步决 策抽象成图中的一条边。我们将这个图称为该组合游戏的游戏图。
3.SG 函数
SG 函数是对游戏图中每一个节点的评估函数。它的定义如下:
f(v) = mex{f(u)|exist an edge from v to u}
如若 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。
其中,mex()运算:
是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
SG函数性质:
(1) 集合S 的终态(图中出度为0的点)必然是空集,所以SG函数的终态为 SG(x) = 0, x 为必败点P。
(2) 对于任意的局面,如果它的 SG 值为 0,那么它的任何一个后继局面 的 SG 值不为 0。
(3) 对于任意的局面,如果它的 SG 值不为 0,那么它一定有一个后继局 面的 SG 值为 0。
【实例】取石子问题
有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f [ ]={1,3,4}
x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4- f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
以此类推.....
x 0 1 2 3 4 5 6 7 8....
SG[x] 0 1 0 1 2 3 2 0 1....
由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:
1、使用 数组f 将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。
四、Anti-SG
1.Anti-SG游戏定义
1、决策集合为空的操作者胜。
2、其余规则与SG游戏一致。
2.SJ定理
对于任意一个Anti-SG游戏,如果定义所有子游戏的SG值为0时游戏结束,先手必胜的条件:
1、游戏的SG值为0且所有子游戏SG值均不超过1。
2、游戏的SG值不为0且至少一个子游戏SG值超过1。
目前就到此为止啦,只有些结论性的东西,听某人的话先去学会应用以后深入学习原理吧~