Codeforces 167B 状态设置的优化

博客探讨了一种动态规划的方法来解决概率问题。参赛者在比赛中赢得不同大小的奖金或背包,目标是计算在赢得至少一定数量比赛并能装下所有奖金的情况下,发挥良好的概率。动态规划状态被设置为前i场比赛,赢了j场比赛,剩余容量为k,通过滚动优化达到O(n^3)的时间复杂度。最终答案是所有满足条件的状态概率之和。
题意:

一名参赛者有一个能装下kkk份奖金的袋子。有nnn场比赛,每场比赛中的胜者会被奖励一个大小为aia_{i}ai的袋子或者是一份奖金。当参赛者赢得至少lll场比赛会被认为是发挥良好。参赛者每次赢的一场比赛后赢的得奖金不必立刻放入他的背包,它可以完成所有比赛后带着所有背包回来装奖金,每场比赛获胜的概率是p[i]p[i]p[i],问最后发挥良好并且能够带走他赢下的所有奖金的概率是多少?

方法:

显然是一个dpdpdp

一开始的思路,设dp[i][j][k]dp[i][j][k]dp[i][j][k]为前iii场,赢了jjj场,并且此时总容量为kkk的概率是多少。注意到最多装下nnn份奖金,于是k>=n+1k>=n+1k>=n+1的部分选择累加在dp[i][j][n+1]dp[i][j][n+1]dp[i][j][n+1]上。最后的答案应该是所有∑j=ln∑k=赢下的奖金场数n+1dp[n][j][k]\sum_{j=l}^{n} \sum_{k=赢下的奖金场数}^{n+1}dp[n][j][k]j=lnk=赢下的奖金场数n+1dp[n][j][k]

我们维护的状态并不能反映赢下的奖金场数这一个概念,于是考虑这样写状态:

dp[i][j][k][l]dp[i][j][k][l]dp[i][j][k][l]为前iii场,赢了jjj场奖金场,kkk场背包场,容量为lll,最后答案为dp[n][j][k][l](l≥i)dp[n][j][k][l](l\geq i)dp[n][j][k][l](li)之和,这样时间复杂度和空间复杂度都是O(n4)O(n^4)O(n4)的,空间可以滚动压缩成O(n3)O(n^3)O(n3),可惜时间复杂度不能优化了。

正解思路是这样,设dp[i][j][k]dp[i][j][k]dp[i][j][k]为前iii场,赢了jjj场,此时容量剩余kkk,这样每次我们赢了一场奖金场,我们就可以在kkk上体现出来,由于kkk可能为负数,那么我们需要加上一个偏移量maxn=200maxn=200maxn=200,这样时间复杂度也为O(n3)O(n^3)O(n3)

at all,设置状态可以选择设两个相互联系的变量来代替三个具体的变量,但并非是无用设置,无用设置比如说将iiin−in-ini设为两个状态,这显然是没必要的。

#include<bits/stdc++.h>
#define ll long long
using namespace std;

int n,l,kk,a[205];
double p[205],dp[205][205][405];

int main()
{
    cin>>n>>l>>kk; //一开始的只能装下k
    kk=min(kk,n);
    for(int i=1;i<=n;i++)
    {
        int tmp; cin>>tmp;
        p[i]=tmp*0.01;
    }
    for(int i=1;i<=n;i++) cin>>a[i];
    //最后表现良好,并且赢的奖品每次都有机会
    //dp[i][j][k] -> 前i场赢了j场。剩余空间为k
    dp[0][0][kk+200]=1;
    for(int i=0;i<n;i++)
    {
        for(int j=0;j<=i;j++)
        {
            for(int k=0;k<=401;k++)
            {
                if(a[i+1]==-1)
                {
                    if(k>=1) dp[i+1][j+1][k-1]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
                else
                {
                    dp[i+1][j+1][min(401,k+a[i+1])]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
            }
        }
    }
    double ans=0;
    for(int i=l;i<=n;i++)
        for(int j=200;j<=401;j++) ans+=dp[n][i][j];
    printf("%.10lf",ans);
    return 0;
}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值