逆推
只不过顺序还是顺着的,思想是逆着的
f[i][j]表示还剩下i张红牌,j张黑牌的期望值
那么边界是
f[i][0]=i,因为只剩i张红牌
f[0][j]=0,只剩黑牌,显然直接停止最优
f[i][j] = max(0,i/(i+j)*f[i-1][j]+j/(i+j)*f[i][j-1])
空间不够,开两层即可
#include <cstdio>
#include <iostream>
#define N 5001
int n, m;
double f[2][N];
//逆推,f[i][j]表示还剩下i张红牌,j张黑牌的期望
int main()
{
int i, j, now;
scanf("%d %d", &n, &m);
for(i = 0; i <= n; i++)
{
now = i & 1;
f[now][0] = i;
for(j = 1; j <= m; j++)
f[now][j] = std::max(0.0, 1.0 * i / (i + j) * (f[now ^ 1][j] + 1) + 1.0 * j / (i + j) * (f[now][j - 1] - 1));
}
printf("%.6lf\n", f[n & 1][m] - 0.0000005);
return 0;
}