SG函数详解

最新推荐文章于 2024-08-26 16:31:24 发布

原创最新推荐文章于 2024-08-26 16:31:24 发布 · 3.2k 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#博弈论

本文介绍了一种名为SG函数的工具，用于处理两人交替操作的复杂博弈问题。通过巴什博弈为例，讲解了P-position和N-position的概念，以及SG函数如何确定最优策略。SG函数与mex函数密切相关，适用于有向无环图的策略计算。文章详细阐述了SG值的计算方法，并给出了实例代码，帮助读者理解并应用在实际博弈问题中。

在之前的博客中我主要介绍了几种常见的博弈论，那些都比较固定，当我们遇到一些新型的博弈问题时，未必可以用之前的模型去解决他，现在我就来介绍一种工具来解决规则比较奇怪的博弈游戏。

先来说一下可以用SG函数解决的问题所需要满足的条件：

（1）游戏人数为两人

（2）两人交替进行某种游戏规定的操作，每次操作，选手都可以在当前合法的操作中选取一种

（3）对于游戏的任意一种可能的局面，合法的操作集合只取决于这个局面的本身，而与操作者无关

就拿巴什博弈举例，每个操作者每次都可以拿走1~m块石头，每次拿走石头的个数取决于当前还剩多少块石头，而与之前的操作无关，这就是一个可以利用SG函数来解决的问题。

下面来对P-position（必败点）和N-position（必胜点）来作下解释：

处在必胜点的选手如果不出现决策上的失误，则选手是必胜的，同理，处在必败点的选手是必败的。

依旧拿巴什博弈举例，假如一开始给定m+2块石头，每次可以取1~m块石头，则先手必胜，所以m+2也就是一个必胜点，若一开始给定m+1块石头，则无论先手第一次取几块石头，后手都可以一次性取完剩余的石头，所以m+1是一个必败点。

必败点和必胜点满足的性质：

（1）终结点是必败点

（2）可以进行一次操作到达必败点的为必胜点

（3）从必败点只能到达必胜点

介绍SG函数前先介绍一下mex函数，表示最小的不属于这个集合的非负整数，比如mex{0,1,3,4}=2,mex{1，2，3}=0;

任何一个可以用SG函数解决的问题都可以抽象成一个有向图游戏，SG函数是用于为这种有向图游戏提供最优策略的。（SG(x)=0代表x为必败态，SG（x）!=0代表x为必胜态）

对于给定游戏规则下的有向无环图，定义SG（x）=mex{SG(y) | y是x的后继}

容易知道终止状态的SG值一定是0，对于一个x满足SG(x)=0,则对于x的所有后继（经过一次操作可到达的状态）y一定有SG（y）!=0,类似的，对于一个x满足SG(x)！=0,则对于x的所有后继y均有SG（y）==0。

顶点SG值的意义：

当SG（x）=k时，表明对于任何一个0<=i<k,都存在x的一个后继y满足SG(y)=i。

下面给出常见博弈论的解题方法：
把原问题按照游戏规则的差别分解成多个独立的子游戏，并计算每个子游戏下的SG值，最后求出所有子游戏的SG值的异或

最后给出SG值的计算方法：

（1）若可选步数为1~m的连续整数（巴什博弈），则SG（x）=x%(m+1)

（2）若可选步数为任意步，则SG（x）=x

（3）剩余的情况只能具体问题具体分析了，下面给出求SG的函数模板

打表计算SG值

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<queue>
using namespace std;
const int N=1e3+10;//具体数据 
int f[N],sg[N],vis[N];
//f[]记录可以进行的操作（比如取走多少个石子）
//sg[]记录每种状态的sg值
//vis[x]用于标记出现过的x的后继的sg值
void SG(int n)
{
	memset(sg,0,sizeof sg);
	//0是终止状态（必败态），所以sg[0]一定为0 
	for(int i=1;i<=n;i++)
	{
		memset(vis,0,sizeof vis);
		for(int j=1;f[j]<=i;j++)
			vis[sg[i-f[j]]]=1;
		//i-f[j]是状态i进行一次操作可以到达的状态 
		for(int j=0;j<=n;j++)//求解i的后继的sg值中未出现的最小自然数 
		{
			if(!vis[j])
			{
				sg[i]=j;
				break;
			}
		} 
	}
}

dfs计算SG值

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<queue>
using namespace std;
const int N=1e3+10;//具体数据 
int f[N],sg[N],vis[N];
//f[]记录可以进行的操作（比如取走多少个石子）
//sg[]记录每种状态的sg值
//vis[x]用于标记出现过的x的后继的sg值
int SG(int x)
{
	//因为sg值可能取到1，所以应该初始化sg数组为-1 
	if(sg[x]!=-1) return sg[x];
	memset(vis,0,sizeof vis);
	for(int i=0;i<n;i++)
	{
		if(x>=f[i])
		{
			SG(x-f[i]);
			vis[sg[x-f[i]]]=1;
		}
	 }
	 int e;
	 for(int i=0;;i++)
	 {
	 	if(!vis[i])
	 	{
	 		e=i;
	 		break;
		}
	 }
	 return sg[x]=e;
}