luogu2734 游戏 A Game(博弈+dp)

本文介绍了一款双人游戏的最优策略问题,并通过区间动态规划的方法实现了程序自动执行最优策略。文章给出了详细的代码实现及解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目

传送门
有如下一个双人游戏:N(2 <= N <= 100)个正整数的序列放在一个游戏平台上,游戏由玩家1开始,两人轮流从序列的任意一端取一个数,取数后该数字被去掉并累加到本玩家的得分中,当数取尽时,游戏结束。以最终得分多者为胜。

编一个执行最优策略的程序,最优策略就是使玩家在与最好的对手对弈时,能得到的在当前情况下最大的可能的总分的策略。你的程序要始终为第二位玩家执行最优策略。

题解

孔老师讲过,如果第一个人是最聪明的,那么先手就可以在奇数位之和与偶数为之和中选一个最大的,从而保证先手必胜。
如果第二个人最有策略呢?或者两个人都是最有策略?
这道题就是一个裸的区间dp,真没看出有博弈来。

f[i][j]表示先手从i-j这段区间中取得最大值。
f[i][j]=max(a[i]+sum(i+1,j)-f[i+1][j],a[j]+sum(i,j-1)-f[i][j-1])

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int n,a[1001],sum[1001],f[101][101];

int main()
{
    scanf("%d",&n);
    for (int i=1; i<=n; i++)
    {
        scanf("%d",&a[i]);
        f[i][i]=a[i];
        sum[i]=sum[i-1]+a[i];
    }
    for (int len=2; len<=n; len++)
    {//区间长度 
        for (int j=len; j<=n; j++)//j从len开始写错了 
        {
            int i=j-len+1;
            if (i<=0) break;
            f[i][j]=max(a[i]+sum[j]-sum[i]-f[i+1][j],a[j]+sum[j-1]-sum[i-1]-f[i][j-1]);
        }
    }
    printf("%d %d",f[1][n],sum[n]-f[1][n]);
    return 0;
}

总结

这个方程,比较妙
一天一DP

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值