2018.08.31 bzoj1419 Red is good（期望dp）_red is good c++-优快云博客

本文链接：https://blog.youkuaiyun.com/dreaming__ldx/article/details/82263399

博客围绕桌面上R张红牌和B张黑牌的翻牌问题展开，翻到红牌得1美元，黑牌付1美元，可随时停止。给出输入输出要求及样例，通过状态转移方程求解最优期望，因不允许开二维数组，采用滚动数组优化空间，并提醒注意答案处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

描述
桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

输入
一行输入两个数R,B,其值在0到5000之间

输出
在最优策略下平均能得到多少钱。

样例输入
5 1
样例输出
4.166666
提示
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

标签
bzoj1419

期望简单题。
令 $f[i][j]$ 表示还剩了i张红牌和j张黑牌时最优期望得到钱数。
那么发现：
$f[i][j]=(f[i-1][j]+1)*i/(i+j)+(f[i][j-1]+1)*j/(i+j)$
但是题目并不允许我们开二维数组。
然而这个状态转移方程只与上一层有关。
因此需要滚动数组优化空间。
我们用f[tmp^1][j]记录上一层状态，f[tmp][i]记录当前层状态。
则有：
$f[tmp][j]=(f[tmp$ ^1 $][j]+1)*i/(i+j)+(f[i][j-1]+1)*j/(i+j)$ 。
还有就是注意答案的处理。
代码：

#include<bits/stdc++.h>
#define N 5005
using namespace std;
int r,b,tmp;
double f[2][N]; 
int main(){
    cin>>r>>b,tmp=1;
    for(int i=1;i<=r;++i){
        f[tmp][0]=i;
        for(int j=1;j<=b;++j)f[tmp][j]=max(0.0,1.0*i/(i+j)*(f[tmp^1][j]+1)+1.0*j/(i+j)*(f[tmp][j-1]-1));
        tmp^=1;
    }
    printf("%0.6lf",floor(f[tmp^1][b]*1e6)*1.0/1e6);
    return 0;
}