CCF201803-4 棋局评估 python做法

本文介绍了一个井字棋游戏的AI评分算法,通过分析棋盘状态,预测Alice和Bob两位玩家在最优策略下的游戏结局得分。文章详细解释了评分规则,并提供了Python实现代码,展示了如何使用递归和深度搜索来评估不同棋局的得分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

试题编号:201803-4
试题名称:棋局评估
时间限制:1.0s
内存限制:256.0MB
问题描述:

问题描述

  Alice和Bob正在玩井字棋游戏。
  井字棋游戏的规则很简单:两人轮流往3*3的棋盘中放棋子,Alice放的是“X”,Bob放的是“O”,Alice执先。当同一种棋子占据一行、一列或一条对角线的三个格子时,游戏结束,该种棋子的持有者获胜。当棋盘被填满的时候,游戏结束,双方平手。
  Alice设计了一种对棋局评分的方法:
  - 对于Alice已经获胜的局面,评估得分为(棋盘上的空格子数+1);
  - 对于Bob已经获胜的局面,评估得分为 -(棋盘上的空格子数+1);
  - 对于平局的局面,评估得分为0;


  例如上图中的局面,Alice已经获胜,同时棋盘上有2个空格,所以局面得分为2+1=3。
  由于Alice并不喜欢计算,所以他请教擅长编程的你,如果两人都以最优策略行棋,那么当前局面的最终得分会是多少?

输入格式

  输入的第一行包含一个正整数T,表示数据的组数。
  每组数据输入有3行,每行有3个整数,用空格分隔,分别表示棋盘每个格子的状态。0表示格子为空,1表示格子中为“X”,2表示格子中为“O”。保证不会出现其他状态。
  保证输入的局面合法。(即保证输入的局面可以通过行棋到达,且保证没有双方同时获胜的情况)
  保证输入的局面轮到Alice行棋。

输出格式

  对于每组数据,输出一行一个整数,表示当前局面的得分。

样例输入

3
1 2 1
2 1 2
0 0 0
2 1 1
0 2 1
0 0 2
0 0 0
0 0 0
0 0 0

样例输出

3
-4
0

样例说明

  第一组数据:
  Alice将棋子放在左下角(或右下角)后,可以到达问题描述中的局面,得分为3。
  3为Alice行棋后能到达的局面中得分的最大值。
  第二组数据:


  Bob已经获胜(如图),此局面得分为-(3+1)=-4。
  第三组数据:
  井字棋中若双方都采用最优策略,游戏平局,最终得分为0。

数据规模和约定

  对于所有评测用例,1 ≤ T ≤ 5。

from copy import deepcopy
def end(now):
    for i in range(3):
        if now[i][0] == now[i][1] == now[i][2] == 1:
            return 1
        elif now[i][0] == now[i][1] == now[i][2] == 2:
            return 2

    for j in range(3):
        if now[0][j] == now[1][j] == now[2][j] ==1:
            return 1
        elif now[0][j] == now[1][j] == now[2][j] ==2:
            return 2

    if now[0][0] == now[1][1] == now[2][2] ==1 or now[0][2] == now[1][1] == now[2][0] ==1:
        return 1
    if now[0][2] == now[1][1] == now[2][0] ==2 or now[0][0] == now[1][1] == now[2][2] ==2:
        return 2
    
    return 0
def get_next(cur_node,player, point):
    i = int(point/3)
    j = point%3
    node = deepcopy(cur_node)
    node[i][j] = player
    return node
def res(end,node):
    if end == 1:#win
        res = 1
        for i in range(3):
            for j in range(3):
                if not node[i][j]:
                    res+=1
    elif end == 2:#lose
        res = -1
        for i in range(3):
            for j in range(3):
                if not node[i][j]:
                    res-=1
    return res

def maxmin(player , cur_node,alph, bet):
    en = end(cur_node)
    if en:
        return res(en,cur_node)
    
    node_list = []  #0-8
    for i in range(3):
        for j in range(3):
            if not cur_node[i][j]:
                 node_list.append(i*3+j)
    blank = len(node_list)
    if not blank:  #ping
        return 0
    #print(cur_node[0],'\n\r',cur_node[1],'\n\r',cur_node[2])
    #print()
    alpha = alph
    beta = bet
    if player == 1:
        #best = 0-blank
        alpha = -10
        for i in node_list:
            new_node = get_next(cur_node,player,i)
            
            val = maxmin(2, new_node,alpha,beta)
            if val>=beta:
                return val
            if val>=alpha:
                alpha=val
        #print('alpha',alpha)
        return alpha
    else:   #2
        #best = blank
        beta = 10
        for i in node_list:
            new_node = get_next(cur_node,player,i)
            val = maxmin(1, new_node,alpha,beta)
            if val<=alpha:
                return val
            if val<=beta:
                beta=val
        #print('beta',beta)
        return beta
    
n = int(input())
inp = [[0,0,0],
       [0,0,0],
       [0,0,0]]
for i in range(n):
    for j in range(3):
        a = input().split()
        inp[j][0] = int(a[0])
        inp[j][1] = int(a[1])
        inp[j][2] = int(a[2])
    
    result = maxmin(1,inp,-10,10)
    print(result)

100分啦,O(∩_∩)O哈哈~。。做了差不多两天了。

注意:python函数调用时的参数是传引用,类似于C++的int my(&a) 所以最好在函数里声明一个变量(beta,alpha)赋值这些参数,这样修改时不至于改变原参数的值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值