【BZOJ1076】奖励关(SCOI2008)-状压DP+期望

本文介绍了一种结合状态压缩动态规划与期望值计算的方法,用于解决特定类型的奖励关卡问题。通过定义状态转移方程,实现了在有限轮次内获取最大期望得分的算法设计,并提供了完整的代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

测试地址:奖励关
做法:本题需要用到状压DP+期望。
首先,在某个时刻掉落了某个宝物,我们是捡还是不捡呢?按照平均情况下最优,也就是期望得分最大,那肯定是按照捡和不捡两种决策做出后,哪个会使期望得分更大而定。具体来说,我们令 f(i,j) f ( i , j ) 为从第 i i 轮开始,已经获得的宝物集合为j,能得到的最大期望得分,那么我们有以下状态转移方程:
对于每种可能掉落的宝物 now n o w ,如果当前能取宝物 now n o w ,对答案有以下贡献:
1nmax(f(i+1,j{now})+pnow,f(i+1,j)) 1 n max ( f ( i + 1 , j ∪ { n o w } ) + p n o w , f ( i + 1 , j ) )
而如果不能取,则对答案有 1nf(i+1,j) 1 n f ( i + 1 , j ) 的贡献。
累加这些贡献,就是我们所求的 f(i,j) f ( i , j ) ,边界条件为 f(n+1,x)=0 f ( n + 1 , x ) = 0 ,答案为 f(1,) f ( 1 , ∅ ) ,用状压DP求出即可。
以下是本人代码:

#include <bits/stdc++.h>
using namespace std;
int k,n,rq[20]={0};
double p[20],f[110][40010]={0};

int main()
{
    scanf("%d%d",&k,&n);
    for(int i=1;i<=n;i++)
    {
        int x;
        scanf("%lf",&p[i]);
        do
        {
            scanf("%d",&x);
            if (x>0) rq[i]|=(1<<(x-1));
        }while(x);
    }

    for(int i=k;i>=1;i--)
        for(int j=0;j<(1<<n);j++)
            for(int now=1;now<=n;now++)
            {
                if ((j&rq[now])==rq[now])
                    f[i][j]+=max(f[i+1][j|(1<<(now-1))]+p[now],f[i+1][j])/(double)n;
                else f[i][j]+=f[i+1][j]/(double)n;
            }
    printf("%.6lf",f[1][0]);

    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值