题意:
一名参赛者有一个能装下kkk份奖金的袋子。有nnn场比赛,每场比赛中的胜者会被奖励一个大小为aia_{i}ai的袋子或者是一份奖金。当参赛者赢得至少lll场比赛会被认为是发挥良好。参赛者每次赢的一场比赛后赢的得奖金不必立刻放入他的背包,它可以完成所有比赛后带着所有背包回来装奖金,每场比赛获胜的概率是p[i]p[i]p[i],问最后发挥良好并且能够带走他赢下的所有奖金的概率是多少?
方法:
显然是一个dpdpdp:
一开始的思路,设dp[i][j][k]dp[i][j][k]dp[i][j][k]为前iii场,赢了jjj场,并且此时总容量为kkk的概率是多少。注意到最多装下nnn份奖金,于是k>=n+1k>=n+1k>=n+1的部分选择累加在dp[i][j][n+1]dp[i][j][n+1]dp[i][j][n+1]上。最后的答案应该是所有∑j=ln∑k=赢下的奖金场数n+1dp[n][j][k]\sum_{j=l}^{n} \sum_{k=赢下的奖金场数}^{n+1}dp[n][j][k]∑j=ln∑k=赢下的奖金场数n+1dp[n][j][k]
我们维护的状态并不能反映赢下的奖金场数这一个概念,于是考虑这样写状态:
设dp[i][j][k][l]dp[i][j][k][l]dp[i][j][k][l]为前iii场,赢了jjj场奖金场,kkk场背包场,容量为lll,最后答案为dp[n][j][k][l](l≥i)dp[n][j][k][l](l\geq i)dp[n][j][k][l](l≥i)之和,这样时间复杂度和空间复杂度都是O(n4)O(n^4)O(n4)的,空间可以滚动压缩成O(n3)O(n^3)O(n3),可惜时间复杂度不能优化了。
正解思路是这样,设dp[i][j][k]dp[i][j][k]dp[i][j][k]为前iii场,赢了jjj场,此时容量剩余kkk,这样每次我们赢了一场奖金场,我们就可以在kkk上体现出来,由于kkk可能为负数,那么我们需要加上一个偏移量maxn=200maxn=200maxn=200,这样时间复杂度也为O(n3)O(n^3)O(n3)的
at all,设置状态可以选择设两个相互联系的变量来代替三个具体的变量,但并非是无用设置,无用设置比如说将iii与n−in-in−i设为两个状态,这显然是没必要的。
#include<bits/stdc++.h>
#define ll long long
using namespace std;
int n,l,kk,a[205];
double p[205],dp[205][205][405];
int main()
{
cin>>n>>l>>kk; //一开始的只能装下k
kk=min(kk,n);
for(int i=1;i<=n;i++)
{
int tmp; cin>>tmp;
p[i]=tmp*0.01;
}
for(int i=1;i<=n;i++) cin>>a[i];
//最后表现良好,并且赢的奖品每次都有机会
//dp[i][j][k] -> 前i场赢了j场。剩余空间为k
dp[0][0][kk+200]=1;
for(int i=0;i<n;i++)
{
for(int j=0;j<=i;j++)
{
for(int k=0;k<=401;k++)
{
if(a[i+1]==-1)
{
if(k>=1) dp[i+1][j+1][k-1]+=dp[i][j][k]*p[i+1];
dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
}
else
{
dp[i+1][j+1][min(401,k+a[i+1])]+=dp[i][j][k]*p[i+1];
dp[i+1][j][k]+=dp[i][j][k]*(1-p[i+1]);
}
}
}
}
double ans=0;
for(int i=l;i<=n;i++)
for(int j=200;j<=401;j++) ans+=dp[n][i][j];
printf("%.10lf",ans);
return 0;
}
博客探讨了一种动态规划的方法来解决概率问题。参赛者在比赛中赢得不同大小的奖金或背包,目标是计算在赢得至少一定数量比赛并能装下所有奖金的情况下,发挥良好的概率。动态规划状态被设置为前i场比赛,赢了j场比赛,剩余容量为k,通过滚动优化达到O(n^3)的时间复杂度。最终答案是所有满足条件的状态概率之和。
744

被折叠的 条评论
为什么被折叠?



