[BZOJ1419] Red is good(期望DP)

本文介绍了一种使用逆推思想求解特定概率问题的方法。通过定义f[i][j]为剩余i张红牌和j张黑牌时的期望值,利用边界条件f[i][0]=i及f[0][j]=0进行逆向递推,最终实现高效计算。

传送门

 

逆推

只不过顺序还是顺着的,思想是逆着的

f[i][j]表示还剩下i张红牌,j张黑牌的期望值

那么边界是

f[i][0]=i,因为只剩i张红牌

f[0][j]=0,只剩黑牌,显然直接停止最优

f[i][j] = max(0,i/(i+j)*f[i-1][j]+j/(i+j)*f[i][j-1])

空间不够,开两层即可

 

#include <cstdio>
#include <iostream>
#define N 5001

int n, m;
double f[2][N];
//逆推,f[i][j]表示还剩下i张红牌,j张黑牌的期望 

int main()
{
	int i, j, now;
	scanf("%d %d", &n, &m);
	for(i = 0; i <= n; i++)
	{
		now = i & 1;
		f[now][0] = i;
		for(j = 1; j <= m; j++)
			f[now][j] = std::max(0.0, 1.0 * i / (i + j) * (f[now ^ 1][j] + 1) + 1.0 * j / (i + j) * (f[now][j - 1] - 1));
	}
	printf("%.6lf\n", f[n & 1][m] - 0.0000005);
	return 0;
}

  

转载于:https://www.cnblogs.com/zhenghaotian/p/7577189.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值