luogu2734 游戏 A Game（博弈+dp）

最新推荐文章于 2022-11-06 19:27:04 发布

A_Comme_Amour

最新推荐文章于 2022-11-06 19:27:04 发布

阅读量428

点赞数

CC 4.0 BY-SA版权

分类专栏：博弈 dp

本文链接：https://blog.youkuaiyun.com/A_Comme_Amour/article/details/79350546

dp 同时被 2 个专栏收录

34 篇文章

订阅专栏

博弈

6 篇文章

订阅专栏

本文介绍了一款双人游戏的最优策略问题，并通过区间动态规划的方法实现了程序自动执行最优策略。文章给出了详细的代码实现及解析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目

传送门
有如下一个双人游戏:N(2 <= N <= 100)个正整数的序列放在一个游戏平台上，游戏由玩家1开始，两人轮流从序列的任意一端取一个数，取数后该数字被去掉并累加到本玩家的得分中，当数取尽时，游戏结束。以最终得分多者为胜。

编一个执行最优策略的程序，最优策略就是使玩家在与最好的对手对弈时，能得到的在当前情况下最大的可能的总分的策略。你的程序要始终为第二位玩家执行最优策略。

题解

孔老师讲过，如果第一个人是最聪明的，那么先手就可以在奇数位之和与偶数为之和中选一个最大的，从而保证先手必胜。
如果第二个人最有策略呢？或者两个人都是最有策略？
这道题就是一个裸的区间dp，真没看出有博弈来。

f[i][j]表示先手从i-j这段区间中取得最大值。
f[i][j]=max(a[i]+sum(i+1,j)-f[i+1][j],a[j]+sum(i,j-1)-f[i][j-1])

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int n,a[1001],sum[1001],f[101][101];

int main()
{
    scanf("%d",&n);
    for (int i=1; i<=n; i++)
    {
        scanf("%d",&a[i]);
        f[i][i]=a[i];
        sum[i]=sum[i-1]+a[i];
    }
    for (int len=2; len<=n; len++)
    {//区间长度 
        for (int j=len; j<=n; j++)//j从len开始写错了 
        {
            int i=j-len+1;
            if (i<=0) break;
            f[i][j]=max(a[i]+sum[j]-sum[i]-f[i+1][j],a[j]+sum[j-1]-sum[i-1]-f[i][j-1]);
        }
    }
    printf("%d %d",f[1][n],sum[n]-f[1][n]);
    return 0;
}

总结

这个方程，比较妙
一天一DP