[SCOI2008] 奖励关

本文介绍了一种使用动态规划解决背包问题的方法,通过定义DP状态dp[i][S]表示在第1轮到第i轮内宝物是否取过的状态为S,第i轮到第K轮的最大期望得分,并通过逆推进行状态转移。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述:

QAQ…

题目分析:

设计DP状态
dp[i][S] 表示在第 1 轮到第 i−1i 轮内宝物是否取过的状态为 S ,第 i 轮到第 K 轮的最大期望得分,那么这样就可以通过逆推进行转移了。
如果当前状态S满足K的前置条件
那么 dp[i][s]+=max(dp[i+1][s],dp[i+1][s|(1<<(k-1))]+v[k])
如果不满足 dp[i][s]+=dp[i+1][s]
而这里求的是期望值,上面求的东西覆盖了第 i 轮取了所有 n 种宝物的情况,所以在每一个状态计算完之后,把 f[i][S] 除以 n 即为期望平均值。

题目链接:

Luogu 2473
BZOJ 1076

Ac 代码:

#include <cstdio>
#include <iostream>
using namespace std;
int q[110],v[110];
double dp[110][(1<<15)];
int main()
{
    int n,k;
    scanf("%d%d",&k,&n);
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&v[i]);
        while(1)
        {
            int x;
            scanf("%d",&x);
            if(!x) break;
            q[i]^=(1<<x-1);
        }
    }
    for(int i=k;i>=1;i--)
     for(int j=0;j<(1<<n);j++)
     {
      for(int p=1;p<=n;p++)
       if((q[p]&j)==q[p])
        dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<p-1)]+v[p]);
       else
        dp[i][j]+=dp[i+1][j];

       dp[i][j]=dp[i][j]/(double)n;
     } 
    printf("%.6lf",dp[1][0]);
    return 0; 
} 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值