CCF201803-4 棋局评估 python做法

最新推荐文章于 2023-02-02 20:50:39 发布

原创最新推荐文章于 2023-02-02 20:50:39 发布 · 486 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#CCF

CCF 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一个井字棋游戏的AI评分算法，通过分析棋盘状态，预测Alice和Bob两位玩家在最优策略下的游戏结局得分。文章详细解释了评分规则，并提供了Python实现代码，展示了如何使用递归和深度搜索来评估不同棋局的得分。

试题编号：	201803-4
试题名称：	棋局评估
时间限制：	1.0s
内存限制：	256.0MB
问题描述：	问题描述　　Alice和Bob正在玩井字棋游戏。　　井字棋游戏的规则很简单：两人轮流往3*3的棋盘中放棋子，Alice放的是“X”，Bob放的是“O”，Alice执先。当同一种棋子占据一行、一列或一条对角线的三个格子时，游戏结束，该种棋子的持有者获胜。当棋盘被填满的时候，游戏结束，双方平手。　　Alice设计了一种对棋局评分的方法：　　- 对于Alice已经获胜的局面，评估得分为(棋盘上的空格子数+1)；　　- 对于Bob已经获胜的局面，评估得分为 -(棋盘上的空格子数+1)；　　- 对于平局的局面，评估得分为0；　　例如上图中的局面，Alice已经获胜，同时棋盘上有2个空格，所以局面得分为2+1=3。　　由于Alice并不喜欢计算，所以他请教擅长编程的你，如果两人都以最优策略行棋，那么当前局面的最终得分会是多少？输入格式　　输入的第一行包含一个正整数T，表示数据的组数。　　每组数据输入有3行，每行有3个整数，用空格分隔，分别表示棋盘每个格子的状态。0表示格子为空，1表示格子中为“X”，2表示格子中为“O”。保证不会出现其他状态。　　保证输入的局面合法。(即保证输入的局面可以通过行棋到达，且保证没有双方同时获胜的情况) 　　保证输入的局面轮到Alice行棋。输出格式　　对于每组数据，输出一行一个整数，表示当前局面的得分。样例输入 3 1 2 1 2 1 2 0 0 0 2 1 1 0 2 1 0 0 2 0 0 0 0 0 0 0 0 0 样例输出 3 -4 0 样例说明　　第一组数据：　　Alice将棋子放在左下角(或右下角)后，可以到达问题描述中的局面，得分为3。　　3为Alice行棋后能到达的局面中得分的最大值。　　第二组数据：　　Bob已经获胜(如图)，此局面得分为-(3+1)=-4。　　第三组数据：　　井字棋中若双方都采用最优策略，游戏平局，最终得分为0。数据规模和约定　　对于所有评测用例，1 ≤ T ≤ 5。

from copy import deepcopy
def end(now):
    for i in range(3):
        if now[i][0] == now[i][1] == now[i][2] == 1:
            return 1
        elif now[i][0] == now[i][1] == now[i][2] == 2:
            return 2

    for j in range(3):
        if now[0][j] == now[1][j] == now[2][j] ==1:
            return 1
        elif now[0][j] == now[1][j] == now[2][j] ==2:
            return 2

    if now[0][0] == now[1][1] == now[2][2] ==1 or now[0][2] == now[1][1] == now[2][0] ==1:
        return 1
    if now[0][2] == now[1][1] == now[2][0] ==2 or now[0][0] == now[1][1] == now[2][2] ==2:
        return 2
    
    return 0
def get_next(cur_node,player, point):
    i = int(point/3)
    j = point%3
    node = deepcopy(cur_node)
    node[i][j] = player
    return node
def res(end,node):
    if end == 1:#win
        res = 1
        for i in range(3):
            for j in range(3):
                if not node[i][j]:
                    res+=1
    elif end == 2:#lose
        res = -1
        for i in range(3):
            for j in range(3):
                if not node[i][j]:
                    res-=1
    return res

def maxmin(player , cur_node,alph, bet):
    en = end(cur_node)
    if en:
        return res(en,cur_node)
    
    node_list = []  #0-8
    for i in range(3):
        for j in range(3):
            if not cur_node[i][j]:
                 node_list.append(i*3+j)
    blank = len(node_list)
    if not blank:  #ping
        return 0
    #print(cur_node[0],'\n\r',cur_node[1],'\n\r',cur_node[2])
    #print()
    alpha = alph
    beta = bet
    if player == 1:
        #best = 0-blank
        alpha = -10
        for i in node_list:
            new_node = get_next(cur_node,player,i)
            
            val = maxmin(2, new_node,alpha,beta)
            if val>=beta:
                return val
            if val>=alpha:
                alpha=val
        #print('alpha',alpha)
        return alpha
    else:   #2
        #best = blank
        beta = 10
        for i in node_list:
            new_node = get_next(cur_node,player,i)
            val = maxmin(1, new_node,alpha,beta)
            if val<=alpha:
                return val
            if val<=beta:
                beta=val
        #print('beta',beta)
        return beta
    
n = int(input())
inp = [[0,0,0],
       [0,0,0],
       [0,0,0]]
for i in range(n):
    for j in range(3):
        a = input().split()
        inp[j][0] = int(a[0])
        inp[j][1] = int(a[1])
        inp[j][2] = int(a[2])
    
    result = maxmin(1,inp,-10,10)
    print(result)

100分啦，O(∩_∩)O哈哈~。。做了差不多两天了。

注意：python函数调用时的参数是传引用，类似于C++的int my（&a）所以最好在函数里声明一个变量(beta,alpha)赋值这些参数，这样修改时不至于改变原参数的值。