Codeforces 167B 状态设置的优化

最新推荐文章于 2025-11-29 17:10:21 发布

原创最新推荐文章于 2025-11-29 17:10:21 发布 · 156 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #动态规划

博客探讨了一种动态规划的方法来解决概率问题。参赛者在比赛中赢得不同大小的奖金或背包，目标是计算在赢得至少一定数量比赛并能装下所有奖金的情况下，发挥良好的概率。动态规划状态被设置为前i场比赛，赢了j场比赛，剩余容量为k，通过滚动优化达到O(n^3)的时间复杂度。最终答案是所有满足条件的状态概率之和。

题意：

一名参赛者有一个能装下 $k$ 份奖金的袋子。有 $n$ 场比赛，每场比赛中的胜者会被奖励一个大小为 $a_{i}$ 的袋子或者是一份奖金。当参赛者赢得至少 $l$ 场比赛会被认为是发挥良好。参赛者每次赢的一场比赛后赢的得奖金不必立刻放入他的背包，它可以完成所有比赛后带着所有背包回来装奖金，每场比赛获胜的概率是 $p [i]$ ，问最后发挥良好并且能够带走他赢下的所有奖金的概率是多少？

方法：

显然是一个 $d p$ ：

一开始的思路，设 $d p [i] [j] [k]$ 为前 $i$ 场，赢了 $j$ 场，并且此时总容量为 $k$ 的概率是多少。注意到最多装下 $n$ 份奖金，于是 $k >= n + 1$ 的部分选择累加在 $d p [i] [j] [n + 1]$ 上。最后的答案应该是所有 $∑j=ln∑k=赢下的奖金场数n+1dp[n][j][k]\sum_{j=l}^{n} \sum_{k=赢下的奖金场数}^{n+1}dp[n][j][k]$

我们维护的状态并不能反映赢下的奖金场数这一个概念，于是考虑这样写状态：

设 $d p [i] [j] [k] [l]$ 为前 $i$ 场，赢了 $j$ 场奖金场， $k$ 场背包场，容量为 $l$ ，最后答案为 $dp[n][j][k][l](l≥i)dp[n][j][k][l](l\geq i)$ 之和，这样时间复杂度和空间复杂度都是 $O(n^4)$ 的，空间可以滚动压缩成 $O(n^3)$ ，可惜时间复杂度不能优化了。

正解思路是这样，设 $d p [i] [j] [k]$ 为前 $i$ 场，赢了 $j$ 场，此时容量剩余 $k$ ，这样每次我们赢了一场奖金场，我们就可以在 $k$ 上体现出来，由于 $k$ 可能为负数，那么我们需要加上一个偏移量 $ma x n = 200$ ，这样时间复杂度也为 $O(n^3)$ 的

at all，设置状态可以选择设两个相互联系的变量来代替三个具体的变量，但并非是无用设置，无用设置比如说将 $i$ 与 $n - i$ 设为两个状态，这显然是没必要的。

#include<bits/stdc++.h>
#define ll long long
using namespace std;

int n,l,kk,a[205];
double p[205],dp[205][205][405];

int main()
{
    cin>>n>>l>>kk; //一开始的只能装下k
    kk=min(kk,n);
    for(int i=1;i<=n;i++)
    {
        int tmp; cin>>tmp;
        p[i]=tmp*0.01;
    }
    for(int i=1;i<=n;i++) cin>>a[i];
    //最后表现良好，并且赢的奖品每次都有机会
    //dp[i][j][k] -> 前i场赢了j场。剩余空间为k
    dp[0][0][kk+200]=1;
    for(int i=0;i<n;i++)
    {
        for(int j=0;j<=i;j++)
        {
            for(int k=0;k<=401;k++)
            {
                if(a[i+1]==-1)
                {
                    if(k>=1) dp[i+1][j+1][k-1]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
                else
                {
                    dp[i+1][j+1][min(401,k+a[i+1])]+=dp[i][j][k]*p[i+1];
                    dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
                }
            }
        }
    }
    double ans=0;
    for(int i=l;i<=n;i++)
        for(int j=200;j<=401;j++) ans+=dp[n][i][j];
    printf("%.10lf",ans);
    return 0;
}