codeforces 623D

最新推荐文章于 2022-05-02 12:26:56 发布

jasonvictoryan

最新推荐文章于 2022-05-02 12:26:56 发布

阅读量856

点赞数 1

CC 4.0 BY-SA版权

分类专栏： greedy probabilities 文章标签： codeforces

本文链接：https://blog.youkuaiyun.com/jasonvictoryan/article/details/51160518

greedy 同时被 2 个专栏收录

3 篇文章

订阅专栏

probabilities

2 篇文章

订阅专栏

探讨了在给定人数及各自被抓概率的条件下，计算所有人至少被抓一次所需轮数的期望值问题。通过动态调整策略使每轮都有较高概率推进进度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原题

原题链接

题目大意

给定 $n\leq100$ 个人，每轮随机选取一个人，每个人被选的概率为 $p_i(精度为0.01),\sum p_i=1$ ,游戏结束当且仅当每个人被抓住一次或以上，问，在最优策略下，期望结束轮数是多少，要求答案精度为 $10^{-6}$ 。

解题思路

设 $f_{i,j}$ 表示第 $i$ 轮结束之后，第 $j$ 个人被抓过的概率。

设 $g_i$ 表示第 $i$ 轮结束之后，所有人都被抓过的概率。
显然 $g_i=\prod_{j=1}^{n} f_{i,j}$ .

$\because Ans=\sum_{i=1}^{+\infty} i*(g_i-g_{i-1})$
$\therefore$ 最优策略就是，尽量使得 $i$ 较小时， $g_i-g_{i-1}$ 较大。

先看看 $f_{i,j}$ 和 $f_{i-1,j}$ 的关系。
$1)f_{i,j}=f_{i-1,j}$ ,第 $i$ 轮不选 $j$ .
$2)f_{i,j}=f_{i-1,j}+(1-f_{i-1,j})*p_j$ ,第 $i$ 轮选 $j$ .

$\therefore g_i=g_{i-1}*f_{i,j}/f_{i-1,j}$
只要求 $f_{i,j}/f_{i-1,j}$ 最大即可，这个可以枚举，或者用数据结构维护。

其实 $3*10^5$ 轮过后答案就不会再有大于 $10^{-6}$ 的误差了。

误差分析

$g_t\geq (1-0.99^{t/100})^{100} \geq1-100·0.99^{t / 100}.$
$\sum_{t=N+1}^{+\infty} 1-g_t\leq100*\sum_{t=N+1}^{+\infty}0.99^{t/100}$ .
所以大概 $3*10^5$ 次运算之后答案就精准了。

参考代码

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
#define maxn 105
#define lim 300000
#define ld long double
#define mem(a,b) memset(a,b,sizeof(a))
#define eps 1e-15
using namespace std;

ld f[2][maxn];

ld g[2],ans;

ld p[maxn];

int n;

int main(){
    scanf("%d",&n);
    fo(i,1,n) {
        cin>>p[i];
        p[i]/=100;
    }
    int last=0,now=1;
    fo(i,1,lim) {
        last^=1;
        now^=1;
        ld best=0;
        int w=0;
        fo(j,1,n) {
            ld thi=(1-f[last][j])*p[j]/f[last][j];
            if (thi>best) {
                best=thi;
                w=j;
            }
        }
        fo(j,1,n) {
            if (j==w) {
                f[now][j]=f[last][j]+(1-f[last][j])*p[j];
            }
            else {
                f[now][j]=f[last][j];
            }
        }
        if (f[last][w]<eps) {
            g[now]=1;
            fo(j,1,n) g[now]=g[now]*f[now][j];
        }
        else g[now]=g[last]*f[now][w]/f[last][w];
        ans=ans+(g[now]-g[last])*i;
    }
    double pri=ans;
    printf("%.16lf",pri);
    return 0;
}