期望DP

最新推荐文章于 2025-06-15 18:04:51 发布

原创最新推荐文章于 2025-06-15 18:04:51 发布 · 447 阅读

3 ·

CC 4.0 BY-SA版权

动态规划专栏收录该内容

18 篇文章

订阅专栏

本文精选三道期望DP题目，深入解析hdu4405、zoj3551及zoj3329的算法思路与实现代码，涵盖骰子游戏、吸血鬼传播模型与多骰子点数期望计算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

推荐一篇大佬的博客：https://www.cnblogs.com/hua-dong/p/8166093.html

直接上例题

1、hdu4405

题意：有n+1个点编号从0->n，有m组通道可以直接从xi->yi不需要花费一次走的次数，每次可投一个骰子，如果点数为x，当前处于i点，即可走到i+x位置，求走到n点的花费的次数的期望。

分析：期望dp一般都是从后往前推，设dp[i]表示从i->n所花费次数期望，显然dp[n]=0，如果没有通道就是

$dp[i]+=\sum_{j=1}^{6}\frac{dp[i+j]}{6}+1$ ，如果有通道(u->v)则是dp[u]=dp[v]，此时不需要加1，因为没有耗费，最后就是求一下dp[0]即可。

Ac code:

#include <bits/stdc++.h>
using namespace std;
const int maxn=1e5+5;
int mp[maxn];
double dp[maxn];
int main()
{
    int n,m,u,v;
    while(~scanf("%d%d",&n,&m)&&(n+m)){
        for(int i=1;i<=m;i++){
            scanf("%d%d",&u,&v);
            mp[u]=v;
        }
        dp[n]=0;
        for(int i=n-1;i>=0;--i)
        {
            if(!mp[i])
            {
                for(int j=1;j<=6;j++)
                    dp[i]+=dp[i+j]/6.0;
                dp[i]+=1;
            }
            else dp[i]=dp[mp[i]];
        }
        printf("%.4f\n",dp[0]);
        for(int i=0;i<=n;i++) dp[i]=mp[i]=0;
    }
    return 0;
}

2、 zoj3551

题意：村子里有n-1个人和1个吸血鬼，保证他们有且只有两个相遇，如果吸血鬼碰上人则人有p的概率变成吸血鬼，其余相遇什么都不会发生，求花费天数的期望使n个全变成吸血鬼。

分析：dp[i]表示已经有i个吸血鬼，要变成n个吸血鬼花费的天数期望，此时产生一个吸血鬼的概率为 $p[i]=\frac{(n-i)*i*p}{C_n^2}$

则dp[i]=dp[i+1]+1/p[i]，dp[n]=0，要求dp[1]

Ac code:

#include <bits/stdc++.h>
using namespace std;
const int maxn=1e5+5;
double dp[maxn];
int main()
{
    int t,n;
    double p;
    scanf("%d",&t);
    while(t--){
        scanf("%d%lf",&n,&p);
        dp[n]=0;
        for(int i=n-1;i>=1;i--){
            double P=2.0*p*(n-i)*i/((double)n*(n-1));
            dp[i]=dp[i+1]+1.0/P;
        }
        printf("%.3f\n",dp[1]);
        for(int i=0;i<=n;i++) dp[i]=0;
    }
    return 0;
}

3、zoj3329

题意：有三个骰子，分别有k1,k2,k3面，初始ans=0，如果三个骰子投出来点数为x1=a，x2=b，x3=c，则ans=0，否则则ans+=

x1+x2+x3，求ans>n所花费的次数期望。

分析：dp[i]表示已经有i分，到达>n分所花费的次数期望，显然dp[i>n]=0，要求dp[0]，设得k分得概率为p[k]，

则p[0]=1/(k1+k2+k3)， $dp[i]=\sum(p_k*dp[i+k])+p_0*dp[0]+1$ ，由于dp[i]和都和dp[0]有关，可设

$dp[i]=dp1[i]*dp[0]+dp2[i]$ ，代入上式得到 $dp1[i]=\sum(p_k*dp1[i+k])+p_0$ ，且 $dp2[i]=\sum(p_k*dp2[i+k])+1$

递推可求得dp1,dp2，最终要求的就是 $dp[0]=\frac{dp2[0]}{1-dp1[0]}$

Ac code:

#include <bits/stdc++.h>
using namespace std;
const int maxn=1e3+5;
double dp1[maxn],dp2[maxn],p[20];
int main()
{
    int t;
    scanf("%d",&t);
    while(t--){
        int n,k1,k2,k3,a,b,c;
        scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
        double p0=1.0/(k1*k2*k3);
        for(int i=1;i<=k1;i++)
            for(int j=1;j<=k2;j++)
               for(int k=1;k<=k3;k++)
                  if(i!=a||j!=b||k!=c)///这里注意,居然写出了i!=a&&j!=b&&k!=c
                     p[i+j+k]+=1.0/(k1*k2*k3);
        memset(dp1,0,sizeof dp1);
        memset(dp2,0,sizeof dp2);
        for(int i=n;i>=0;--i){
            for(int j=3;j<=k1+k2+k3;j++){
                dp1[i]+=dp1[i+j]*p[j];
                dp2[i]+=dp2[i+j]*p[j];
            }
            dp1[i]+=p0;
            dp2[i]+=1;
        }
        printf("%.15f\n",dp2[0]/(1-dp1[0]));
        for(int i=0;i<=k1+k2+k3;i++) p[i]=0;
    }
    return 0;
}