POJ 1678[I Love this Game!]题解

一道结合博弈论和动态规划的题目,描述了两个人轮流选择数的过程,目标是在对手最优策略下最大化自己的得分。先手需要找到能获得最大分差的开局策略,可能面临亏损或无法开始的情况。解决方案是使用记忆化DFS,定义状态表示先手选取特定数后的最大分差,并通过转移方程进行计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(传送门)
题目大意
给定n个数和一个区间[L,R],双方轮流操作,要求第一个人要先选一个数,这个数在区间[L,R]上,然后第二个人选一个数,这个数要比第一个人选的数大,而且两数之差在区间[L,R]上,当其中有一人无法取数时,游戏结束,此时先手获利的多少在于他选的数的和与后手的选的和的差。现在作为先手的你需要在后手无论如何都做出最优策略的情况下,让自己的获利最大。(注意你有可能会亏损,这时输出最小的亏损量,也有可能一开始就无法取数,这时输出0)

题目分析

这道题明显看出已经不仅仅是单纯的博弈论中输和赢的事件,还有要利益最大,这样就想到用DP或贪心,不过贪心的想法很快就会毙掉,那么DP,定义f[i],表示先手选了从小到大第i个数,能达到的最大分差,最后一次取得时候只有一个数,分差就是本身,否则有转移方程。

if (L<=a[j]-a[i]&&a[j]-a[i]<=R) tem=max(tem,a[j]);
f[i]=a[i]-tem;

这样写原因很简单,因为后手也是最后策略走的。所以挑最大的,就是后手接下来的策略,减掉就行。
这里写的是记忆化DFS,DP试了一下好像不行……

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int tst,n,L,R,a[10005],f[10005],INF;
inline void readi(int &x)
{
    x=0; int f=1; char ch=getchar();
    while ('0'>ch||ch>'9')
    {
        if (ch=='-') f=-f;
        ch=getchar();
    }
    while ('0'<=ch&&ch<='9')
    {
        x=x*10+ch-'0';
        ch=getchar();
    }
    x*=f;
}
void _init()
{
    readi(n); readi(L); readi(R);
    for (int i=1;i<=n;i++) readi(a[i]);
    sort(a+1,a+n+1);
    memset(f,192,sizeof(f)); INF=f[0];
}
int _dfs(int x)
{
    if (f[x]!=INF) return f[x];
    int ans=INF;
    for (int i=x+1;i<=n;i++)
        if (L<=a[i]-a[x]&&a[i]-a[x]<=R) ans=max(ans,_dfs(i));
    if (ans==INF) f[x]=a[x];
    else f[x]=a[x]-ans;
    return f[x];
}
void _solve()
{
    int ans=INF;
    for (int i=1;i<=n;i++)
      if (L<=a[i]&&a[i]<=R) ans=max(ans,_dfs(i));
    if (ans==INF) printf("0\n"); else printf("%d\n",ans);
}
int main()
{
    readi(tst);
    while (tst--)
    {
        _init();
        _solve();
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值