OX 【HRBUST - 2320】

最新推荐文章于 2020-04-21 16:28:02 发布

这里是一只小小琪

最新推荐文章于 2020-04-21 16:28:02 发布

阅读量202

点赞数

CC 4.0 BY-SA版权

分类专栏： # 2019省赛集训个人和组队赛

本文链接：https://blog.youkuaiyun.com/qq_41925919/article/details/89533402

2019省赛集训个人和组队赛专栏收录该内容

17 篇文章

订阅专栏

本文探讨了井字棋游戏中的最优策略，通过三进制压缩状态和动态规划方法，判断在双方玩家采取最优策略时游戏结局的可能性。文章详细解释了如何通过编码棋盘状态并搜索所有可能的后续状态来预测胜利者或平局。

题目链接 HRBUST 2320

Kim喜欢玩井字棋。但是他从来都没有赢过：）Kim非常好奇井字棋是否有一个必胜的策略。
给定一个局面，以及下一步该谁走（o或x），请判断在双方都足够聪明的情况下（双方一直采用最优策略），是否有一个人能够获胜（或者平局）。

Input
第一行一个整数T代表数据组数。
接下来T组数据，每组数据三行，每行三个字符串（o 或 x 或 .）
o表示这个位置有一个o
x表示这个位置有一个x
.表示这个位置是空的
接下来一行一个字符串（o 或 x），表示下一步该这个人走了。

Output
如果x有必胜策略，输出 “x win!”（不含引号）。
如果o有必胜策略，输出 “o win!”（不含引号）。
如果双方在最有策略下只能平局，输出 “tie!” （不含引号）。

解题思路

我们用三进制压缩状态来表示现在棋盘中的状态。
dp[state][now]表示现在的状态是state轮到了now（2或者1）下棋的时候是必胜状态还是必败状态或者平局。
一个状态是必败状态当且仅当所有的后继状态都是必胜状态
一个状态是必胜状态当且仅当它的后继中至少有一个后继是必败状态
所以我们枚举当前状态的所有可能的后继状态，来判断这个状态是必胜，必败或者是平局的状态。
在代码中dp[state][now]:1表示必胜，2表示必败，0表示平局
now：1表示x下棋，1表示o下棋

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
char s[5];
int dp[20005][3];
int state(int c[5][5])//三进制压缩表示当前状态
{
    int ans=0;
    for(int i=0; i<3; i++)
    {
        for(int j=0; j<3; j++)
        {
            ans=ans*3+c[i][j];
        }
    }
    return ans;
}
int solve(int ss,int now)
{
    if(~dp[ss][now])//这个状态之前已经搜过了直接返回
        return dp[ss][now];
    int c[5][5],xx=ss;
    memset(c,0,sizeof(c));
    for(int i=2; i>=0; i--)//把棋盘状态从三进制解压回来
    {
        for(int j=2; j>=0; j--)
        {
            c[i][j]=xx%3;
            xx/=3;
        }
    }
    //当对手已经连成一条线的时候
    if(c[0][0]!=0&&c[0][1]==c[0][0]&&c[0][2]==c[0][0]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[1][0]!=0&&c[1][0]==c[1][1]&&c[1][0]==c[1][2]&&c[1][0]!=now) return dp[ss][now]=2;
    if(c[2][0]!=0&&c[2][0]==c[2][1]&&c[2][0]==c[2][2]&&c[2][0]!=now) return dp[ss][now]=2;
    if(c[0][0]!=0&&c[0][0]==c[1][0]&&c[0][0]==c[2][0]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[0][1]!=0&&c[0][1]==c[1][1]&&c[0][1]==c[2][1]&&c[0][1]!=now) return dp[ss][now]=2;
    if(c[0][2]!=0&&c[0][2]==c[1][2]&&c[0][2]==c[2][2]&&c[0][2]!=now) return dp[ss][now]=2;
    if(c[0][0]!=0&&c[0][0]==c[1][1]&&c[0][0]==c[2][2]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[0][2]!=0&&c[0][2]==c[1][1]&&c[0][2]==c[2][0]&&c[0][2]!=now) return dp[ss][now]=2;

    //当自己的棋子连成一条线的时候
    if(c[0][0]!=0&&c[0][1]==c[0][0]&&c[0][2]==c[0][0]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[1][0]!=0&&c[1][0]==c[1][1]&&c[1][0]==c[1][2]&&c[1][0]==now) return dp[ss][now]=1;
    if(c[2][0]!=0&&c[2][0]==c[2][1]&&c[2][0]==c[2][2]&&c[2][0]==now) return dp[ss][now]=1;
    if(c[0][0]!=0&&c[0][0]==c[1][0]&&c[0][0]==c[2][0]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[0][1]!=0&&c[0][1]==c[1][1]&&c[0][1]==c[2][1]&&c[0][1]==now) return dp[ss][now]=1;
    if(c[0][2]!=0&&c[0][2]==c[1][2]&&c[0][2]==c[2][2]&&c[0][2]==now) return dp[ss][now]=1;
    if(c[0][0]!=0&&c[0][0]==c[1][1]&&c[0][0]==c[2][2]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[0][2]!=0&&c[0][2]==c[1][1]&&c[0][2]==c[2][0]&&c[0][2]==now) return dp[ss][now]=1;

    int flag=0;
    for(int i=0; i<3; i++)
        for(int j=0; j<3; j++)
            if(c[i][j]==0)
                flag=1;
    if(!flag) //当棋盘已经被下满并且没有相同颜色的棋子连成一条线就是平局
        return dp[ss][now]=0;

    int cnt=0;
    int f[20];
    memset(f,0,sizeof(f));
    for(int i=0; i<3; i++)
        for(int j=0; j<3; j++)
        {
            if(c[i][j]==0)//枚举这个状态的所有可能的后继状态
            {
                c[i][j]=now;
                f[++cnt]=solve(state(c),3-now);
                c[i][j]=0;
            }
        }
    int flag1=0,flag2=0;
    for(int i=1; i<=cnt; i++)
    {
        if(f[i]==2)
            flag1=1;
        else if(f[i]==0)
            flag2=1;
    }
    if(flag1)//当后继状态中有一个必败状态那么当前状态就是一个必胜状态
        return dp[ss][now]=1;
    else if(flag2)//后继状态中没有必败态有平局态
        return dp[ss][now]=0;
    else//后继状态都是必胜态的时候
        return dp[ss][now]=2;
}
int main()
{
    int T;
    char f[2];
    scanf("%d",&T);
    while(T--)
    {
        memset(dp,-1,sizeof(dp));
        int c[5][5];
        memset(c,0,sizeof(c));
        //输入棋盘状态
        for(int i=0; i<3; i++)
        {
            for(int j=0; j<3; j++)
            {
                scanf("%s",s);
                if(s[0]=='.')
                    c[i][j]=0;
                else if(s[0]=='x')
                    c[i][j]=1;
                else
                    c[i][j]=2;
            }
        }
        int ss=state(c);
        scanf("%s",f);
        int sum;
        if(f[0]=='x')
            sum=solve(ss,1);
        else
            sum=solve(ss,2);

        if(f[0]=='x')
        {
            if(sum==1)
                printf("x win!\n");
            else if(sum==2)
                printf("o win!\n");
            else
                printf("tie!\n");
        }
        else
        {
            if(sum==1)
                printf("o win!\n");
            else if(sum==2)
                printf("x win!\n");
            else
                printf("tie!\n");
        }
    }
    return 0;
}