这题是一个比较难的概率题,你只知道上限是k,并且被警告的次数最多是w次,然后问你最优策略下取完所有钱的次数的期望
dp[k][w]表示钱的范围是0−k,剩余w次警告的机会的期望
dp[k][w]=minki=1dp[k−i][w]∗k+1−ik+1+dp[i−1][w−1]∗ik+1+1
状态和转移写完了,但是这题的边界情况也很复杂
考虑到如果只有钱的范围是0−0,那么dp[0][w]=0
如果钱的范围是0−1,那么dp[1][w]=1
因为你知道上限了,并且最少要取一块钱啊,所以不会触发警告了
w=0的时候不好考虑,因为如果你最后上限是0−1,必须再取一次确定是0还是1
w=1时,dp[k][1]表示钱的范围是0−k,但是你只有一次警告机会了,所以必须每次取1
如果你的钱是i,那么你需要去i+1次,如果你的钱是k,那么就取k次,因为上限,所以对于范围是0−k,有k+1种情况,所以dp[k][1]=k(k+1)2+kk+1
这样的复杂度是O(k2w),是过不去的,但是考虑的是最优策略,所以二分可以比穷举更优
因为log(2000)很小,所以可以直接把w=min(w,15),然后就是O(k2w)的复杂度
但是这样还是会T,所以要把dp数组在外面预处理好,进去O(1)的查询就行了
#include <map>
#include <set>
#include <stack>
#include <queue>
#include <cmath>
#include <string>
#include <vector>
#include <cstdio>
#include <cctype>
#include <cstring>
#include <sstream>
#include <cstdlib>
#include <iostream>
#include <algorithm>
#pragma comment(linker,"/STACK:102400000,102400000")
using namespace std;
#define MAX 200005
#define MAXN 1000005
#define maxnode 205
#define sigma_size 26
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define lrt rt<<1
#define rrt rt<<1|1
#define middle int m=(r+l)>>1
#define LL long long
#define ull unsigned long long
#define mem(x,v) memset(x,v,sizeof(x))
#define lowbit(x) (x&-x)
#define pii pair<int,int>
#define bits(a) __builtin_popcount(a)
#define mk make_pair
#define limit 10000
//const int prime = 999983;
const int INF = 0x3f3f3f3f;
const LL INFF = 0x3f3f;
const double pi = acos(-1.0);
const double inf = 1e18;
const double eps = 1e-4;
const LL mod = 1e9+7;
const ull mx = 133333331;
/*****************************************************/
inline void RI(int &x) {
char c;
while((c=getchar())<'0' || c>'9');
x=c-'0';
while((c=getchar())>='0' && c<='9') x=(x<<3)+(x<<1)+c-'0';
}
/*****************************************************/
double dp[2005][20];
int main(){
//freopen("in.txt","r",stdin);
int k,w;
mem(dp[0],0);
for(int i=0;i<=2000;i++){
dp[i][1]=(1.0*(1+i)*i/2+i)/(i+1);
}
for(int W=2;W<=15;W++){
for(int i=1;i<=2000;i++){
dp[i][W]=INF;
for(int j=1;j<=i;j++){
dp[i][W]=min(dp[i][W],1+dp[i-j][W]*(i+1-j)/(i+1)+dp[j-1][W-1]*j/(i+1));
}
}
}
while(cin>>k>>w){
w=min(15,w);
printf("%.6f\n",dp[k][w]);
}
return 0;
}