描述
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付 出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
输入
一行输入两个数R,B,其值在0到5000之间
输出
在最优策略下平均能得到多少钱。
样例输入
5 1
样例输出
4.166666
提示
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
标签
bzoj1419
期望简单题。
令f[i][j]f[i][j]表示还剩了i张红牌和j张黑牌时最优期望得到钱数。
那么发现:
f[i][j]=(f[i−1][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)f[i][j]=(f[i−1][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)
但是题目并不允许我们开二维数组。
然而这个状态转移方程只与上一层有关。
因此需要滚动数组优化空间。
我们用f[tmp^1][j]记录上一层状态,f[tmp][i]记录当前层状态。
则有:
f[tmp][j]=(f[tmpf[tmp][j]=(f[tmp^1][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)][j]+1)∗i/(i+j)+(f[i][j−1]+1)∗j/(i+j)。
还有就是注意答案的处理。
代码:
#include<bits/stdc++.h>
#define N 5005
using namespace std;
int r,b,tmp;
double f[2][N];
int main(){
cin>>r>>b,tmp=1;
for(int i=1;i<=r;++i){
f[tmp][0]=i;
for(int j=1;j<=b;++j)f[tmp][j]=max(0.0,1.0*i/(i+j)*(f[tmp^1][j]+1)+1.0*j/(i+j)*(f[tmp][j-1]-1));
tmp^=1;
}
printf("%0.6lf",floor(f[tmp^1][b]*1e6)*1.0/1e6);
return 0;
}