hdu 4089 Activation

本文探讨了在游戏官网激活过程中,当服务器出现故障时,第m位玩家Tomato在队列中的位置小于等于k的概率计算。通过概率动态规划方法,分析了不同情况下玩家激活成功的概率,并最终求解了目标状态的概率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:

有n个人排队等着在官网上激活游戏。Tomato排在第m个。

对于队列中的第一个人。有一下情况:
1、激活失败,留在队列中等待下一次激活(概率为p1)
2、失去连接,出队列,然后排在队列的最后(概率为p2)
3、激活成功,离开队列(概率为p3)
4、服务器瘫痪,服务器停止激活,所有人都无法激活了。
求服务器瘫痪时Tomato在队列中的位置<=k的概率

解析:
概率DP;
设dp[i][j]表示i个人排队,Tomato排在第j个位置,达到目标状态的概率(j<=i)
dp[n][m]就是所求
j==1: dp[i][1]=p1*dp[i][1]+p2*dp[i][i]+p4;
2<=j<=k: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1]+p4;
k<j<=i: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1];
化简:
j==1: dp[i][1]=p*dp[i][i]+p41;    dp[i][i]是未知的,需要每次迭代出来
2<=j<=k: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1]+p41;
k<j<=i: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1];

其中:
p=p2/(1-p1);
p31=p3/(1-p1)
p41=p4/(1-p1)

可以循环i=1->n 递推求解dp[i][i].在求解dp[i][i]的时候dp[i-1]就相当于常数了。
在求解dp[i][1~i]时等到下列i个方程
j==1: dp[i][1]=p*dp[i][i]+c[1];
2<=j<=k:dp[i][j]=p*dp[i][j-1]+c[j];
k<j=i: dp[i][j]=p*dp[i][j]+c[j];
其中c[j]都是常数了。上述方程可以解出dp[i]了。

首先是迭代得到 dp[i][i].然后再代入就可以得到所有的dp[i]了。


#include<iostream>
#include<cstdio>
#include<string.h>
#include<math.h>
using namespace std;
#define N 2005
#define esp 1e-6
double dp[N][N],pp[N],c[N];
int main()
{
    int i,j,k,n,m;
    double p1,p2,p3,p4,p21,p31,p41;
    while(~scanf("%d%d%d%lf%lf%lf%lf",&n,&m,&k,&p1,&p2,&p3,&p4))
    {
        if(p4<esp)
        {
            puts("0.00000");
            continue;
        }
        p21=p2/(1-p1);
        p31=p3/(1-p1);
        p41=p4/(1-p1);
        dp[1][1]=p41/(1-p21);

        pp[0]=1.0;//pp[i]=p^1;
        for(int i=1; i<=n; i++) pp[i]=p21*pp[i-1];
        c[1]=p41;
        for(int i=2; i<=n; i++)
        {
            for(int j=2; j<=i; j++)
            {
                if(j<=k)
                    c[j]=p31*dp[i-1][j-1]+p41;
                else
                    c[j]=p31*dp[i-1][j-1];
            }
            double tmp=c[1]*pp[i-1];
            for(int j=2; j<=i; j++)
            {
                if(j<=k)
                 tmp+=c[j]*pp[i-j];
                else
               tmp+=c[j]*pp[i-j];
            }
            dp[i][i]=tmp/(1-pp[i]);  //每次先迭代求出dp[i][i]
            dp[i][1]=p21*dp[i][i]+c[1];
            for(int j=2; j<i; j++)
            dp[i][j]=p21*dp[i][j-1]+c[j];
        }
        /*
        for(i=2; i<=n; i++)
        {
            for(j=1; j<=i; j++)
            {
                if(j==1)        dp[i][j]=dp[i][i]*p21+p41;  // dp[i][i]不知道。。。。。
                else if(j<=k)   dp[i][j]=dp[i][j-1]*p21+dp[i-1][j-1]*p31+p41;
                else            dp[i][j]=dp[i][j-1]*p21+dp[i-1][j-1]*p31;
            }
        }
        */
        printf("%.5lf\n",dp[n][m]);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值