codeforces105 D(概率dp)

本文通过定义状态dp[i][j]来求解公主与龙博弈问题中公主获胜的概率,使用递推公式进行状态转移,实现了动态规划算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:公主和龙轮流从袋子取出老鼠,袋子里面有白鼠很黑鼠,规定先取出白鼠的一方赢,并且龙取出老鼠之后袋子里面的一只老鼠会随机跳出,取老鼠的时候也是随机的,现在公主先取,问你公主赢的概率是多少,当袋子里面没有老鼠的时候,并且还没有分出胜负,规定龙赢

思路:定义dp[i][j]代表袋子里面还有i白鼠和j黑鼠公主赢的概率

那么可以列出以下方程

dp[i][j]=i/ij+j/ij*(j-1)/(ij-1)*(dp[i-1][j-2]*i/(ij-2)+dp[i][j-3]*(j-2)/(ij-2));

其中ij=i+j;表示的意义是这个状态下公主取到白鼠的概率是i/ij;或者取到黑鼠(概率是j/ij),要使公主赢,则必须龙取到剩下所有中的黑鼠( (j-i)/(ij-1) )并且分为白鼠跳出和黑鼠跳出两种情况,这样就可以转移了



#include<cstdio>
#include<iostream>
using namespace std;
double dp[1110][1110];
int main()
{
    int w,b;
    while(~scanf("%d%d",&w,&b))
    {
        for(int j=0;j<=b;j++)dp[0][j]=0;
        for(int i=1;i<=w;i++)dp[i][0]=1;
        for(int i=1;i<=w;i++)
        {
            for(int j=1;j<=b;j++)
            {
                double ij=i+j;
                if(j>=3)dp[i][j]=i/ij+j/ij*(j-1)/(ij-1)*(dp[i-1][j-2]*i/(ij-2)+dp[i][j-3]*(j-2)/(ij-2));
                else if(j==2) dp[i][j]=i/ij+j/ij*(j-1)/(ij-1)*dp[i-1][j-2]*i/(ij-2);
                else dp[i][j]=i/ij;
            }
        }
        printf("%.9lf\n",dp[w][b]);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值