博弈论学习小记

博客围绕取石子游戏展开,介绍了巴什博弈,指出当n%(m + 1)=0时为先手必败状态。还分析了实例S - Nim,该题在Nim游戏基础上加了条件,解题引入SG函数,通过计算Grundy值判断局面胜负,与处理Nim问题同理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考
https://www.cnblogs.com/Wolfycz/p/8430991.html
http://www.cnblogs.com/frog112111/p/3199780.html

引言

取石子游戏:A和B两人轮流取走共n颗的石子,每次可取1,2或3颗。A先取,取走最后一颗石子的人获胜。
思考:A有没有必胜的策略?
分析:当n为0,4,8,12……时,A必定会输,因为不论A取多少,B只要和A共同取走4即可;当n不为0,4,8,12……时,A只需要将n取成4的倍数,这样就变成了B先取,B一定会输,所以A一定会赢。
也就是说,对这个游戏而言,0,4,8,12……这些状态是对于先手的必败状态,而其他状态是对于先手的必胜状态。
以此类推,如果每次不一定取1,2,3颗,而是取1∼m颗,那么就可以得到,如果n%(m+1)=0,即为先手必败状态,否则为先手必胜状态。而这个游戏就是著名的巴什博弈(Bash Game)。博弈的许多题目就是从巴什博奕变换而来的。

一、实例S-Nim及解题分析
题目链接
Input
2 2 5
3
2 5 12
3 2 4 7
4 2 3 7 12
5 1 2 3 4 5
3
2 5 12
3 2 4 7
4 2 3 7 12
0
Sample Output:
LWW
WWL

题目大意:
此题在Nim游戏的基础上加了条件,给出一个集合S={s1,s2,…,sk}k个正整数,A、B每次取石子的数目必须是集合里的数,拿最后一个珠子的人获胜。
k s1 s2 … sk
m
n1 x1 x2 … xn
n2 x1 x2… xn

nm x1 x2… xn
给出一个数k,代表集合S的大小,接下来紧跟着k个数,表示集合S里的数。接下来一行数为m代表有m个游戏,后面m行每行第一个数字为n代表有n堆石子,后面紧跟着n个数x1…xn代表每堆石子的个数。
输出n个字母,第i个字母为“W”代表第i个游戏先手必胜,“L”代表第i个游戏先手必败。
注意:对于状态可能有循环时,需要注意平局的情况,但这个游戏中石子数是始终减少的,所以不存在这种状况。

解题思路:
这道题比巴什博奕看起来要难一些。我们的问题仍然是求知A是否还有必胜策略。第一想法是dp做,但状态数太多,搜索和动态规划都无法完成,就需要考虑别的方法。
需要寻找哪些状态是P状态,哪些是N状态。
算法设计:
引入SG(Sprague-Grundy)函数
f(v)=mex{f(u)∣u为v的后继状态}
它的自变量是任意整数集合,函数值是不属于该集合的最小自然数。
mex(A)=min{k|k∈∁NA}
mex(S)为求出不属于集合S的最小非负整数的运算。
SG(n)对应的值就是《挑竞》中说的Grundy值。
根据当前状态的grundy值是除任意一步所能转移到的状态的Grundy值以外的最小非负整数这个性质来计算Grundy值。
这样的grundy值,和Nim中的一个石子堆类似,有下列性质
1.Nim中有x颗石子的石子堆,能够转移成有0,1,…,x-1颗石子的石子堆
2.从Grundy值为x的状态出发,可以转移到grundy值为0,1,…,x-1的状态。
与Nim不同的是,转移后的Grundy值有可能增加。
对于Nim,需要把所有堆的石子异或一遍,最后得到的值若为0则是必败态,非0则为必胜态。
而对于此题,SG(G)=SG(1) xor SG(2) xor SG(3)…xor SG(m)
某个局面必败,当且仅当该局面对应的SG函数值>0
某个局面必败,当且仅当该局面对应的SG函数值=0(没办法再拿出石子)
简单说,终止状态的SG值显然为0,并且SG值为0的状态就是P状态,SG值不为0的状态就是N状态。
即与处理Nim问题同理。

注意对于sg(x)的理解(想了好久)
下面是一个例子,有助于对sg函数的理解(并不是简单的集合的数+1,而是需要递推关系所得):
有1堆n个的石子,每次只能取{1,3,4}个石子,先取完石子者胜利,那么各个数的SG值为多少?

sg[0]=0,f[]={1,3,4},
x=1时,可以取走1-f{1}个石子,剩余{0}个,mex{sg[0]}={0},故sg[1]=1;
x=2时,可以取走2-f{1}个石子,剩余{1}个,mex{sg[1]}={1},故sg[2]=0;
x=3时,可以取走3-f{1,3}个石子,剩余{2,0}个,mex{sg[2],sg[0]}={0,0},故sg[3]=1;
x=4时,可以取走4-f{1,3,4}个石子,剩余{3,1,0}个,mex{sg[3],sg[1],sg[0]}={1,1,0},故sg[4]=2;
x=5时,可以取走5-f{1,3,4}个石子,剩余{4,2,1}个,mex{sg[4],sg[2],sg[1]}={2,0,1},故sg[5]=3;
以此类推…
x 0 1 2 3 4 5 6 7 8…
sg[x] 0 1 0 1 2 3 2 0 1…

3、关键代码(sg函数的计算)

sg[x] x表示的是石子数
sg[x]表示石子数=x的状态时能取到的不属于集合S的最小非负整数
size是k(集合s的元素个数)

    const int N=1e2,M=1e4;
    int S[N+10],sg[M+10];
    bool vis[N+10];
    int size;
    	void prepare(){
        memset(sg,0,sizeof(sg));//每次游戏都要算一次sg
        for (int i=1;i<=M;i++)//   i代表的是石子数
        {
            memset(vis,0,sizeof(vis));
            for (int j=1;j<=size;j++)
            {                   //      j<=k  (所能取的石子数集合元素个数)
                if (i<S[j]) break;         //如果石子数<所能取的石子数 跳出
                vis[sg[i-S[j]]]=1; 
      //递推表达式否则标记vis[sg[剩下的石子数]=(之前计算的sg[])]=1
            }
            for (int j=0;j<=N;j++)  if (!vis[j]){sg[i]=j;break;} sg[]=最小能取的个数
        }
    }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值