The Moon 【HDU - 6558】【期望DP】

最新推荐文章于 2020-10-12 16:39:46 发布

原创最新推荐文章于 2020-10-12 16:39:46 发布 · 261 阅读

1 ·

CC 4.0 BY-SA版权

DP 专栏收录该内容

27 篇文章

订阅专栏

本文介绍了一种通过动态规划算法解决游戏轮数期望问题的方法。游戏中玩家每轮胜利后概率会变化，目标是计算获得玩具平均需要多少轮。文章详细解释了递推公式的推导过程，并提供了一个C++实现的代码示例。

题目链接

题目大意

有一个游戏分为4步
1.初始概率q=2%；
2.玩家一轮游戏赢的概率为p，如果他这轮赢了，将进入步骤3，否则进去步骤4
3.玩家有q的概率得到一个玩具，如果得到玩具，游戏结束，如果没有得到玩具就让q变为
min（100,q+2%）；
4.让q变为min（100，q+1.5%）；
问游戏轮数的期望

解题思路

这个题的递推公式还是简单的，一共有三种情况，要么拿到玩具结束，要么让q+2%，要么让q+1.5%
我乘了10，因为有小数
dp[i]+=q*p;
dp[i]+=(1.0-q) * (dp[min(1000,i+20)]+1.0) * p;
dp[i]+=(1.0-p) * (dp[min(1000,i+15)]+1.0);
注意超出的地方应该根据题意写。
比赛的时候公式很早就推出来了，让我难受的是初始化，dp[1000]应该是1/p
因为如果进行n次，前n-1次都失败，第n次成功，符合几何分布。

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
double dp[10000];
double p;
int main()
{
    int T,pp=1;
    scanf("%d",&T);
    while(T--)
    {
        int P;
        scanf("%d",&P);
        p=(double)P/100.0;
        memset(dp,0,sizeof(dp));
//        for(int i=1005;i<=1015;i++)
//            dp[i]=1;
dp[1000]=1/p;
        for(int i=999; i>=20; i--)
        {
            double q=(double)i/(double)1000;
            dp[i]+=q*p;
            dp[i]+=(1.0-q)*(dp[min(1000,i+20)]+1.0)*p;
            dp[i]+=(1.0-p)*(dp[min(1000,i+15)]+1.0);
        }
        printf("Case %d: ",pp++);
        printf("%.10f\n",dp[20]);
    }
    return 0;
}