2018.08.31 bzoj1419 Red is good(期望dp)

博客围绕桌面上R张红牌和B张黑牌的翻牌问题展开,翻到红牌得1美元,黑牌付1美元,可随时停止。给出输入输出要求及样例,通过状态转移方程求解最优期望,因不允许开二维数组,采用滚动数组优化空间,并提醒注意答案处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

描述
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付 出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

输入
一行输入两个数R,B,其值在0到5000之间

输出
在最优策略下平均能得到多少钱。

样例输入
5 1
样例输出
4.166666
提示
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

标签
bzoj1419


期望简单题。
f[i][j]f[i][j]表示还剩了i张红牌和j张黑牌时最优期望得到钱数。
那么发现:
f[i][j]=(f[i1][j]+1)i/(i+j)+(f[i][j1]+1)j/(i+j)f[i][j]=(f[i−1][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)
但是题目并不允许我们开二维数组。
然而这个状态转移方程只与上一层有关。
因此需要滚动数组优化空间。
我们用f[tmp^1][j]记录上一层状态,f[tmp][i]记录当前层状态。
则有:
f[tmp][j]=(f[tmpf[tmp][j]=(f[tmp^1][j]+1)i/(i+j)+(f[i][j1]+1)j/(i+j)][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)
还有就是注意答案的处理。
代码:

#include<bits/stdc++.h>
#define N 5005
using namespace std;
int r,b,tmp;
double f[2][N]; 
int main(){
    cin>>r>>b,tmp=1;
    for(int i=1;i<=r;++i){
        f[tmp][0]=i;
        for(int j=1;j<=b;++j)f[tmp][j]=max(0.0,1.0*i/(i+j)*(f[tmp^1][j]+1)+1.0*j/(i+j)*(f[tmp][j-1]-1));
        tmp^=1;
    }
    printf("%0.6lf",floor(f[tmp^1][b]*1e6)*1.0/1e6);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值