nim(尼姆博弈) Nim游戏

最新推荐文章于 2022-08-17 22:00:58 发布

obsorb_knowledge

最新推荐文章于 2022-08-17 22:00:58 发布

阅读量706

点赞数

CC 4.0 BY-SA版权

分类专栏：数论博弈论

本文链接：https://blog.youkuaiyun.com/obsorb_knowledge/article/details/79257962

数论博弈论专栏收录该内容

6 篇文章

订阅专栏

本文详细探讨了Nim游戏的最优策略，通过分析不同局面下的胜负情况，提出了判断游戏状态的P-position和N-position概念，并给出了利用异或运算判断游戏胜负的具体算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有n堆石子，每堆各有ai颗石子。Alice和Bob轮流从非空的石子堆中取走至少一颗石子。Alice先取，取光所有石子的一方获胜。当双方都采取最优策略时，谁会获胜？

限制条件

1<=n<=1000000

1<=ai<=10^9

输入

n = 3

a = {1,2,4}

输出

Alice

这游戏看上去有点复杂，先从简单情况开始研究吧。如果轮到你的时候，只剩下一堆石子，那么此时的必胜策略肯定是把这堆石子全部拿完一颗也不给对手剩，然后对手就输了。如果剩下两堆不相等的石子，必胜策略是通过取多的一堆的石子将两堆石子变得相等，以后如果对手在某一堆里拿若干颗，你就可以在另一堆中拿同样多的颗数，直至胜利。如果你面对的是两堆相等的石子，那么此时你是没有任何必胜策略的，反而对手可以遵循上面的策略保证必胜。如果是三堆石子……好像已经很难分析了，看来我们必须要借助一些其它好用的（最好是程式化的）分析方法了，或者说，我们最好能够设计出一种在有必胜策略时就能找到必胜策略的算法。

定义P-position和N-position，其中P代表Previous，N代表Next。直观的说，上一次move的人有必胜策略的局面是P-position，也就是“后手可保证必胜”或者“先手必败”，现在轮到move的人有必胜策略的局面是N-position，也就是“先手可保证必胜”。更严谨的定义是：1.无法进行任何移动的局面（也就是terminal position）是P-position；2.可以移动到P-position的局面是N-position；3.所有移动都导致N-position的局面是P-position。

P-position 为必败态，N-position 为必胜态，必胜态可以通过某一种移动后到达必败态，当然也可以到达必胜态；但必败态不管怎么移动后，到达只有必胜态，不可能到达必败态，也就是说，不管怎么移，留个后者的是都是必胜态，只要后者按照自己的最优策略走，后者就能赢；

先说出结论：

(Bouton's Theorem)：对于一个Nim游戏的局面(a1,a2,...,an)，它是P-position当且仅当a1^a2^...^an=0，其中^表示异或(xor)运算。

怎么样，是不是很神奇？我看到它的时候也觉得很神奇，完全没有道理的和异或运算扯上了关系。但这个定理的证明却也不复杂，基本上就是按照两种position的证明来的。

根据定义，证明一种判断position的性质的方法的正确性，只需证明三个命题： 1、这个判断将所有terminal position判为P-position；2、根据这个判断被判为N-position的局面一定可以移动到某个P-position；3、根据这个判断被判为P-position的局面无法移动到某个P-position。

第一个命题显然，terminal position只有一个，就是全0，异或仍然是0。

第二个命题，对于某个局面(a1,a2,...,an)，若a1^a2^...^an!=0，一定存在某个合法的移动，将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。不妨设a1^a2^...^an=k，则一定存在某个ai，它的二进制表示在k的最高位上是1（否则k的最高位那个1是怎么得到的）。这时ai^k<ai一定成立。则我们可以将ai改变成ai'=ai^k，此时a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。

第三个命题，对于某个局面(a1,a2,...,an)，若a1^a2^...^an=0，一定不存在某个合法的移动，将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。因为异或运算满足消去率，由a1^a2^...^an=a1^a2^...^ai'^...^an可以得到ai=ai'。所以将ai改变成ai'不是一个合法的移动。证毕。

根据这个定理，我们可以在O(n)的时间内判断一个Nim的局面的性质，且如果它是N-position，也可以在O(n)的时间内找到所有的必胜策略。Nim问题就这样基本上完美的解决了。

Nim游戏的形象具体论述：

为了进一步理解Nim取子游戏，我们考查某些特殊情况。如果游戏开始时只有一堆硬币，游戏人I则通过取走所有的硬币而获胜。现在设有2堆硬币，且硬币数量分别为N₁和N₂。游戏人取得胜利并不在于N1和N2的值具体是多少，而是取决于它们是否相等。设N₁！=N₂，游戏人I从大堆中取走的硬币使得两堆硬币数量相等，于是，游戏人I以后每次取子的数量与游戏人II相等而最终获胜。但是如果N₁= N₂，则：游戏人II只要按着游戏人I取子的数量在另一堆中取相等数量的硬币，最终获胜者将会是游戏人II。这样，两堆的取子获胜策略就已经找到了。

现在我们如何从两堆的取子策略扩展到任意堆数中呢？

首先来回忆一下，每个正整数都有对应的一个二进制数，例如：57₍₁₀₎à 111001₍₂₎ ，即：57₍₁₀₎=2⁵+2⁴+2³+2⁰。于是，我们可以认为每一堆硬币数由2的幂数的子堆组成。这样，含有57枚硬币大堆就能看成是分别由数量为2⁵、2⁴、2³、2⁰的各个子堆组成。

现在考虑各大堆大小分别为N₁，N₂，……N_k的一般的Nim取子游戏。将每一个数N_i表示为其二进制数（数的位数相等，不等时在前面补0）：

N₁= a_s…a₁a₀

N₂= b_s…b₁b₀

……

N_k= m_s…m₁m₀

如果每一种大小的子堆的个数都是偶数，我们就称Nim取子游戏是平衡的（这句话我不是太懂），而对应位相加是偶数的称为平衡位，否则称为非平衡位。因此，Nim取子游戏是平衡的，当且仅当：（我的理解是：对应位相加是偶数的为平衡位，对应位相加为奇数为非平衡位）

a_s+ b_s + … + m_s 是偶数

……

a₁+ b₁+ … + m₁是偶数

a₀+ b₀ + … + m₀是偶数

于是，我们就能得出获胜策略：

在游戏I先取的情况下，游戏人I能够在非平衡态取子游戏中取胜，而游戏人II能够在平衡态的取子游戏中取胜。

我们以一个两堆硬币的Nim取子游戏作为试验。设游戏开始时游戏处于非平衡状态。这样，游戏人I就能通过一种取子方式使得他取子后留给游戏人II的是一个平衡状态下的游戏，接着无论游戏人II如何取子，再留给游戏人I的一定是一个非平衡状态游戏，如此反复进行，当游戏人II在最后一次平衡状态下取子后，游戏人I便能一次性取走所有的硬币而获胜。而如果游戏开始时游戏牌平衡状态，那根据上述方式取子，最终游戏人II能获胜。通过对上述的理解可以认为平衡态是必败态，非平衡态为必胜态。

下面应用此获胜策略来考虑4-堆的Nim取子游戏。其中各堆的大小分别为7，9，12，15枚硬币。用二进制表示各数分别为：0111，1001，1100和1111。于是可得到如下一表：

	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1
大小为7的堆	0	1	1	1
大小为9的堆	1	0	0	1
大小为12的堆	1	1	0	0
大小为15的堆	1	1	1	1

由Nim取子游戏的平衡条件可知，此游戏是一个非平衡状态的取子游戏，因此，游戏人I在按获胜策略进行取子游戏下将一定能够取得最终的胜利。具体做法有多种，游戏人I可以从大小为12的堆中取走11枚硬币，使得游戏达到平衡（如下表），

	2³ = 8	2² = 4	2¹ = 2	2⁰ = 1
大小为7的堆	0	1	1	1
大小为9的堆	1	0	0	1
大小为12的堆	0	0	0	1
大小为15的堆	1	1	1	1

之后，无论游戏人II如何取子，全部都是从平衡态到达非平衡态，不可能从平衡态到达平衡态，游戏人I通过游戏人II的取法制定策略，就能在取子后仍使得游戏达到平衡态（还不懂的话就好好理解结论里的第二个证明）。

同样的道理，游戏人I也可以选择大小为9的堆并取走5枚硬币而剩下4枚，或者，游戏人I从大小为15的堆中取走13枚而留下2枚。

归根结底，Nim取子游戏的关键在于游戏开始时游戏处于何种状态（平衡或非平衡）和第一个游戏人是否能够按照取子游戏的获胜策略来进行游戏。

上面那道题无非就是判断当前为平衡态还是非平衡态

代码：

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
int main()
{
	int i,j,n;
	while(~scanf("%d",&n))
	{
		int k = 0,tt;
		for(i = 0;i < n;i ++)
		{
			scanf("%d",&tt);
			k ^=tt;
		}
		if(k) printf("Alice\n");
		else printf("Bob\n");
	}
	return 0;
}