OX 【HRBUST - 2320】

本文探讨了井字棋游戏中的最优策略,通过三进制压缩状态和动态规划方法,判断在双方玩家采取最优策略时游戏结局的可能性。文章详细解释了如何通过编码棋盘状态并搜索所有可能的后续状态来预测胜利者或平局。

题目链接 HRBUST 2320

Kim喜欢玩井字棋。但是他从来都没有赢过:)Kim非常好奇井字棋是否有一个必胜的策略。
给定一个局面,以及下一步该谁走(o或x),请判断在双方都足够聪明的情况下(双方一直采用最优策略),是否有一个人能够获胜(或者平局)。

Input
第一行一个整数T代表数据组数。
接下来T组数据,每组数据三行,每行三个字符串(o 或 x 或 .)
o表示这个位置有一个o
x表示这个位置有一个x
.表示这个位置是空的
接下来一行一个字符串(o 或 x),表示下一步该这个人走了。

Output
如果x有必胜策略,输出 “x win!”(不含引号)。
如果o有必胜策略,输出 “o win!”(不含引号)。
如果双方在最有策略下只能平局,输出 “tie!” (不含引号)。

解题思路

我们用三进制压缩状态来表示现在棋盘中的状态。
dp[state][now]表示现在的状态是state轮到了now(2或者1)下棋的时候是必胜状态还是必败状态或者平局。
一个状态是必败状态当且仅当所有的后继状态都是必胜状态
一个状态是必胜状态当且仅当它的后继中至少有一个后继是必败状态

所以我们枚举当前状态的所有可能的后继状态,来判断这个状态是必胜,必败或者是平局的状态。
在代码中dp[state][now]:1表示必胜,2表示必败,0表示平局
now:1表示x下棋,1表示o下棋

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
char s[5];
int dp[20005][3];
int state(int c[5][5])//三进制压缩表示当前状态
{
    int ans=0;
    for(int i=0; i<3; i++)
    {
        for(int j=0; j<3; j++)
        {
            ans=ans*3+c[i][j];
        }
    }
    return ans;
}
int solve(int ss,int now)
{
    if(~dp[ss][now])//这个状态之前已经搜过了直接返回
        return dp[ss][now];
    int c[5][5],xx=ss;
    memset(c,0,sizeof(c));
    for(int i=2; i>=0; i--)//把棋盘状态从三进制解压回来
    {
        for(int j=2; j>=0; j--)
        {
            c[i][j]=xx%3;
            xx/=3;
        }
    }
    //当对手已经连成一条线的时候
    if(c[0][0]!=0&&c[0][1]==c[0][0]&&c[0][2]==c[0][0]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[1][0]!=0&&c[1][0]==c[1][1]&&c[1][0]==c[1][2]&&c[1][0]!=now) return dp[ss][now]=2;
    if(c[2][0]!=0&&c[2][0]==c[2][1]&&c[2][0]==c[2][2]&&c[2][0]!=now) return dp[ss][now]=2;
    if(c[0][0]!=0&&c[0][0]==c[1][0]&&c[0][0]==c[2][0]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[0][1]!=0&&c[0][1]==c[1][1]&&c[0][1]==c[2][1]&&c[0][1]!=now) return dp[ss][now]=2;
    if(c[0][2]!=0&&c[0][2]==c[1][2]&&c[0][2]==c[2][2]&&c[0][2]!=now) return dp[ss][now]=2;
    if(c[0][0]!=0&&c[0][0]==c[1][1]&&c[0][0]==c[2][2]&&c[0][0]!=now) return dp[ss][now]=2;
    if(c[0][2]!=0&&c[0][2]==c[1][1]&&c[0][2]==c[2][0]&&c[0][2]!=now) return dp[ss][now]=2;

    //当自己的棋子连成一条线的时候
    if(c[0][0]!=0&&c[0][1]==c[0][0]&&c[0][2]==c[0][0]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[1][0]!=0&&c[1][0]==c[1][1]&&c[1][0]==c[1][2]&&c[1][0]==now) return dp[ss][now]=1;
    if(c[2][0]!=0&&c[2][0]==c[2][1]&&c[2][0]==c[2][2]&&c[2][0]==now) return dp[ss][now]=1;
    if(c[0][0]!=0&&c[0][0]==c[1][0]&&c[0][0]==c[2][0]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[0][1]!=0&&c[0][1]==c[1][1]&&c[0][1]==c[2][1]&&c[0][1]==now) return dp[ss][now]=1;
    if(c[0][2]!=0&&c[0][2]==c[1][2]&&c[0][2]==c[2][2]&&c[0][2]==now) return dp[ss][now]=1;
    if(c[0][0]!=0&&c[0][0]==c[1][1]&&c[0][0]==c[2][2]&&c[0][0]==now) return dp[ss][now]=1;
    if(c[0][2]!=0&&c[0][2]==c[1][1]&&c[0][2]==c[2][0]&&c[0][2]==now) return dp[ss][now]=1;

    int flag=0;
    for(int i=0; i<3; i++)
        for(int j=0; j<3; j++)
            if(c[i][j]==0)
                flag=1;
    if(!flag) //当棋盘已经被下满并且没有相同颜色的棋子连成一条线就是平局
        return dp[ss][now]=0;

    int cnt=0;
    int f[20];
    memset(f,0,sizeof(f));
    for(int i=0; i<3; i++)
        for(int j=0; j<3; j++)
        {
            if(c[i][j]==0)//枚举这个状态的所有可能的后继状态
            {
                c[i][j]=now;
                f[++cnt]=solve(state(c),3-now);
                c[i][j]=0;
            }
        }
    int flag1=0,flag2=0;
    for(int i=1; i<=cnt; i++)
    {
        if(f[i]==2)
            flag1=1;
        else if(f[i]==0)
            flag2=1;
    }
    if(flag1)//当后继状态中有一个必败状态那么当前状态就是一个必胜状态
        return dp[ss][now]=1;
    else if(flag2)//后继状态中没有必败态有平局态
        return dp[ss][now]=0;
    else//后继状态都是必胜态的时候
        return dp[ss][now]=2;
}
int main()
{
    int T;
    char f[2];
    scanf("%d",&T);
    while(T--)
    {
        memset(dp,-1,sizeof(dp));
        int c[5][5];
        memset(c,0,sizeof(c));
        //输入棋盘状态
        for(int i=0; i<3; i++)
        {
            for(int j=0; j<3; j++)
            {
                scanf("%s",s);
                if(s[0]=='.')
                    c[i][j]=0;
                else if(s[0]=='x')
                    c[i][j]=1;
                else
                    c[i][j]=2;
            }
        }
        int ss=state(c);
        scanf("%s",f);
        int sum;
        if(f[0]=='x')
            sum=solve(ss,1);
        else
            sum=solve(ss,2);

        if(f[0]=='x')
        {
            if(sum==1)
                printf("x win!\n");
            else if(sum==2)
                printf("o win!\n");
            else
                printf("tie!\n");
        }
        else
        {
            if(sum==1)
                printf("o win!\n");
            else if(sum==2)
                printf("x win!\n");
            else
                printf("tie!\n");
        }
    }
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值