【poj2096】Collecting Bugs(期望dp)

本文探讨了一位程序员在多个系统中寻找不同类型的Bug所需的平均天数问题,并通过动态规划的方法给出了具体的解决步骤及代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:

我是超链接

题意:有s个系统,有n种bug,bug的数量不限,一位程序员每天可以发现一个bug 

现在求发现n种bug存在s个系统中并且每个系统都要被发现bug的平均天数(期望) 

题解:

看来能化的就要化到最简,这样就少一些精度错误

虽然不太清楚为什么,可能是套路吧做多了就好了

在这里有s,n两个变量,假设dp[i][j]表示已经发现i种bug存在j个系统到目标所需要的天数,显然dp[n][s]=0;  

从dp[i][j]经过一天后可能得到以下四种情况: 

dp[i][j]->dp[i+1][j+1];//在一个新的系统里面发现一个新的bug 

dp[i][j]->dp[i+1][j];//在原来已发现过bug的系统里发现一个新的bug 

dp[i][j]->dp[i][j+1];//在一个新的系统里面发现一个已被发现过的bug 

dp[i][j]->dp[i][j];//在已发现过bug的系统发现已发现过的bug  

四种到达的概率分别是: 

p1=(n-i)*(s-j)/(n*s); 

p2=(n-i)*j/(n*s); 

p3=i*(s-j)/(n*s); 

p4=i*j/(n*s); 

然后根据E(aA+bB+cC+dD+...)=aEA+bEB+....;//a,b,c,d...表示概率,A,B,C...表示状态 

所以dp[i][j]=p1*dp[i+1][j+1]+p2*dp[i+1][j]+p3*dp[i][j+1]+p4*dp[i][j]+1;//dp[i][j]表示的就是到达状态i,j的期望  

=>dp[i][j]=(p1*dp[i+1][j+1]+p2*dp[i+1][j]+p3*dp[i][j+1]+1)/(1-p4); 


代码:

#include <cstdio>
using namespace std;
double dp[1005][1005];
int main()
{
	int n,s,i,j;
	scanf("%d%d",&n,&s);//n个bug,s个系统 
	dp[n][s]=0;int ns=n*s;
	for (i=n;i>=0;i--)//dp[i][j]表示已经找到i种bug,j个系统的期望天数 
	  for (j=s;j>=0;j--)
	  {
	  	if (i==n && j==s) continue;
	  	//dp[i][j]=((dp[i][j]*(i*j)/(n*s)+dp[i][j+1]*(i*(s-j))/(n*s)+dp[i+1][j]*((n-i)*j)/(n*s)+dp[i+1][j+1]*((n-i)*(s-j))/(n*s)))/((1.0-(i*j)/(n*s)));最开始的式子 
	  	//dp[i][j]=((1.0+dp[i][j+1]*(i*(s-j))/(n*s)+dp[i+1][j]*((n-i)*j)/(n*s)+dp[i+1][j+1]*((n-i)*(s-j))/(n*s)))/((1.0-(i*j)/(n*s))); 对这种就是错的,虽然和下面的式子一样,但是/n*s毕竟不是准确的 
		dp[i][j]=(ns+dp[i][j+1]*(i*(s-j))+dp[i+1][j]*((n-i)*j)+dp[i+1][j+1]*((n-i)*(s-j)))/(n*s-i*j);	 
	  }
	printf("%.4lf",dp[0][0]);
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值