SG函数详解

本文介绍了一种名为SG函数的工具,用于处理两人交替操作的复杂博弈问题。通过巴什博弈为例,讲解了P-position和N-position的概念,以及SG函数如何确定最优策略。SG函数与mex函数密切相关,适用于有向无环图的策略计算。文章详细阐述了SG值的计算方法,并给出了实例代码,帮助读者理解并应用在实际博弈问题中。

在之前的博客中我主要介绍了几种常见的博弈论,那些都比较固定,当我们遇到一些新型的博弈问题时,未必可以用之前的模型去解决他,现在我就来介绍一种工具来解决规则比较奇怪的博弈游戏。

先来说一下可以用SG函数解决的问题所需要满足的条件:

(1)游戏人数为两人

(2)两人交替进行某种游戏规定的操作,每次操作,选手都可以在当前合法的操作中选取一种

(3)对于游戏的任意一种可能的局面,合法的操作集合只取决于这个局面的本身,而与操作者无关

就拿巴什博弈举例,每个操作者每次都可以拿走1~m块石头,每次拿走石头的个数取决于当前还剩多少块石头,而与之前的操作无关,这就是一个可以利用SG函数来解决的问题。

下面来对P-position(必败点)和N-position(必胜点)来作下解释:

处在必胜点的选手如果不出现决策上的失误,则选手是必胜的,同理,处在必败点的选手是必败的。

依旧拿巴什博弈举例,假如一开始给定m+2块石头,每次可以取1~m块石头,则先手必胜,所以m+2也就是一个必胜点,若一开始给定m+1块石头,则无论先手第一次取几块石头,后手都可以一次性取完剩余的石头,所以m+1是一个必败点。

必败点和必胜点满足的性质:

(1)终结点是必败点

(2)可以进行一次操作到达必败点的为必胜点

(3)从必败点只能到达必胜点

介绍SG函数前先介绍一下mex函数,表示最小的不属于这个集合的非负整数,比如mex{0,1,3,4}=2,mex{1,2,3}=0;

任何一个可以用SG函数解决的问题都可以抽象成一个有向图游戏,SG函数是用于为这种有向图游戏提供最优策略的。(SG(x)=0代表x为必败态,SG(x)!=0代表x为必胜态)

对于给定游戏规则下的有向无环图,定义SG(x)=mex{SG(y) | y是x的后继}

容易知道终止状态的SG值一定是0,对于一个x满足SG(x)=0,则对于x的所有后继(经过一次操作可到达的状态)y一定有SG(y)!=0,类似的,对于一个x满足SG(x)!=0,则对于x的所有后继y均有SG(y)==0。

顶点SG值的意义:

当SG(x)=k时,表明对于任何一个0<=i<k,都存在x的一个后继y满足SG(y)=i。

下面给出常见博弈论的解题方法:
把原问题按照游戏规则的差别分解成多个独立的子游戏,并计算每个子游戏下的SG值,最后求出所有子游戏的SG值的异或

最后给出SG值的计算方法:

(1)若可选步数为1~m的连续整数(巴什博弈),则SG(x)=x%(m+1)

(2)若可选步数为任意步,则SG(x)=x

(3)剩余的情况只能具体问题具体分析了,下面给出求SG的函数模板

打表计算SG值

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<queue>
using namespace std;
const int N=1e3+10;//具体数据 
int f[N],sg[N],vis[N];
//f[]记录可以进行的操作(比如取走多少个石子)
//sg[]记录每种状态的sg值
//vis[x]用于标记出现过的x的后继的sg值
void SG(int n)
{
	memset(sg,0,sizeof sg);
	//0是终止状态(必败态),所以sg[0]一定为0 
	for(int i=1;i<=n;i++)
	{
		memset(vis,0,sizeof vis);
		for(int j=1;f[j]<=i;j++)
			vis[sg[i-f[j]]]=1;
		//i-f[j]是状态i进行一次操作可以到达的状态 
		for(int j=0;j<=n;j++)//求解i的后继的sg值中未出现的最小自然数 
		{
			if(!vis[j])
			{
				sg[i]=j;
				break;
			}
		} 
	}
} 

dfs计算SG值

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#include<queue>
using namespace std;
const int N=1e3+10;//具体数据 
int f[N],sg[N],vis[N];
//f[]记录可以进行的操作(比如取走多少个石子)
//sg[]记录每种状态的sg值
//vis[x]用于标记出现过的x的后继的sg值
int SG(int x)
{
	//因为sg值可能取到1,所以应该初始化sg数组为-1 
	if(sg[x]!=-1) return sg[x];
	memset(vis,0,sizeof vis);
	for(int i=0;i<n;i++)
	{
		if(x>=f[i])
		{
			SG(x-f[i]);
			vis[sg[x-f[i]]]=1;
		}
	 }
	 int e;
	 for(int i=0;;i++)
	 {
	 	if(!vis[i])
	 	{
	 		e=i;
	 		break;
		}
	 }
	 return sg[x]=e;
} 
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值