codeforces 148D 【概率dp】

本文解析了 Codeforces 平台上的 148D Bag of Mice 问题,通过动态规划的方法求解公主获胜的概率。详细介绍了状态转移方程及其背后的逻辑。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目链接:codeforces 148D Bag of mice


题意:一个包里面有w只白老鼠和b只黑老鼠,公主与龙依次从包中拿老鼠,每次取一只,当龙拿时还会从包中溜走一只,先拿到老鼠的获胜,当背包中没老鼠时且之前没人拿到白老鼠则龙获胜,问公主获胜的概率是多少。


题解:

设dp[i][j]为背包中有i只白老鼠j只黑老鼠时公主获胜的概率

则公主获胜的情况分成三种:

1.直接拿到白老鼠 p1=i/(i+j)

2.公主拿到黑老鼠,龙拿到黑老鼠,逃跑一只黑老鼠 p2=(j/(i+j)) * ((j-1)/(i+j-1)) * ((j-2)/(i+j-2)) * dp[i][j-3]

3.公主拿到黑老鼠,龙拿到黑老鼠,逃跑一只黑老鼠 p3=(j/(i+j)) * ((j-1)/(i+j-1)) * (i/(i+j-2)) * dp[i-1][j-2]

所以dp[i][j] = p1+p2+p3


#include<iostream>
#include<stdio.h>
#include<algorithm>
#include<cmath>
#include<stdlib.h>
#include<string.h>
#include<queue>
#include<set>
#include<map>
#include<stack>
#include<time.h>
#include<sstream>

using namespace std;
#define MAX_N 100005
#define inf 0x3f3f3f3f
#define LL long  long
#define ull unsigned long long
const LL INF = 1e18;
const double eps = 1e-8;
//const int mod = 1e9+7;
//const double pi = acos(-1);
typedef pair<int, int>P;

double dp[1005][1005];
int main()
{
    int w, b;
    cin >> w >> b;
    memset(dp, 0, sizeof(dp));
    for(int i=1; i<=w; i++) {
        for(int j=0; j<=b; j++) {
            dp[i][j] = 1.0*i/(i+j);
            if(j-3 >= 0)
                dp[i][j] += (1.0*j/(i+j))*(1.0*(j-1)/(i+j-1))*(1.0*(j-2)/(i+j-2))*dp[i][j-3];
            if(j-2 >= 0)
                dp[i][j] += (1.0*j/(i+j))*(1.0*(j-1)/(i+j-1))*(1.0*i/(i+j-2))*dp[i-1][j-2];
        }
    }
    printf("%.9lf\n", dp[w][b]);
}

区间DP是一种动态规划的方法,用于解决区间范围内的问题。在Codeforces竞赛中,区间DP经常被用于解决一些复杂的字符串或序列相关的问题。 在区间DP中,dp[i][j]表示第一个序列前i个元素和第二个序列前j个元素的最优解。具体的转移方程会根据具体的问题而变化,但是通常会涉及到比较两个序列的元素是否相等,然后根据不同的情况进行状态转移。 对于区间长度为1的情况,可以先进行初始化,然后再通过枚举区间长度和区间左端点,计算出dp[i][j]的值。 以下是一个示例代码,展示了如何使用区间DP来解决一个字符串匹配的问题: #include <cstdio> #include <cstring> #include <string> #include <iostream> #include <algorithm> using namespace std; const int maxn=510; const int inf=0x3f3f3f3f; int n,dp[maxn][maxn]; char s[maxn]; int main() { scanf("%d", &n); scanf("%s", s + 1); for(int i = 1; i <= n; i++) dp[i][i] = 1; for(int i = 1; i <= n; i++) { if(s[i] == s[i - 1]) dp[i][i - 1] = 1; else dp[i][i - 1] = 2; } for(int len = 3; len <= n; len++) { int r; for(int l = 1; l + len - 1 <= n; l++) { r = l + len - 1; dp[l][r] = inf; if(s[l] == s[r]) dp[l][r] = min(dp[l + 1][r], dp[l][r - 1]); else { for(int k = l; k <= r; k++) { dp[l][r] = min(dp[l][r], dp[l][k] + dp[k + 1][r]); } } } } printf("%d\n", dp[n]); return 0; } 希望这个例子能帮助你理解区间DP的基本思想和应用方法。如果你还有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值