2022杭电多校 Bowcraft

Silence_Jy

已于 2022-10-09 00:10:44 修改

阅读量337

点赞数 1

分类专栏：概率dp 文章标签：算法

于 2022-07-23 16:32:40 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_60896526/article/details/125948766

版权

概率dp 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一种解决 Bowcraft 游戏中升级策略问题的方法，通过动态规划计算在给定升级书概率条件下，达到特定等级所需的期望购书数。关键在于构建转移方程，利用书籍的升级概率和降级概率，找出最优升级路径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1006 Bowcraft

题意：

商店提供多种升级书，每本升级书有 $\frac aA$ 的概率升一级，如果升级失败，有 $\frac bB$ 的概率使等级降为0。每购买一本书，会等概率的从 $[0, A - 1]$ 中生成数字 $a$ ,从 $[0, B - 1]$ 中生成数字 $b$ 。问在最优策略下升到 $k$ 级买书的期望数量。

分析：

考虑 $d p$ 求解： $d p [i]$ 表示从0级升到 $i$ 级的期望买书数量。
假设当前买的书的状态是 $(a, b)$ ，则我们可以选择使用或者不使用：
令 $\alpha=\frac aA, \beta=\frac bB$
1.若使用这本书，则升到 $i + 1$ 级的期望是：
$Y=dp[i+1]=dp[i]+1+(1-\alpha)*(1-\beta)*(dp[i+1]-dp[i])+(1-\alpha)*\beta*dp[i+1])$
解释一下： 我们成功升一级的期望是 $d p [i] + 1$ ,因为要购买一本书，次数+1;如果我们升级失败但没有降为0级，即等级不变： $(1-\alpha)*(1-\beta)*(dp[i+1]-dp[i])$ ,前面是发生的概率，很好理解，后面的话是发生这种事件的次数，即我们从 $i$ 级升到 $i + 1$ 级的次数；如果我们升级失败且等级降为0： $(1-\alpha)*\beta*dp[i+1])$ ，当发生时，我们需要重新升到 $i + 1$ 级，即乘上升到 $i + 1$ 级的期望。
2.若不使用：
$X = d p [i + 1] = d p [i + 1] + 1$

解释一下 ：我们不使用这本书升到 $i + 1$ 级，但是我们依旧购买了这本书，次数+1.

因此我们得到转移方程：
$dp[i+1]=\frac {1}{AB}\sum_{a,b}min\{ X,Y\}$

因为我们要采取最优策略升级，那么如果我们要想使用该本书升级，那么需满足使用的期望 $\le$ 不使用的期望 $(Y\le X)$
化简得到 $\geq dp[i]*\frac{\alpha-\alpha \beta+\beta}{\alpha}$
观察该式子，发现 $\frac{\alpha-\alpha \beta+\beta}{\alpha}$ 越小的书越容易被使用，即书的 $\frac{\alpha-\alpha \beta+\beta}{\alpha}$ 越小越好。
那么我们将所有书的 $\frac{\alpha-\alpha \beta+\beta}{\alpha}$ 排序，枚举取前 $t$ 小的书，那么
化简 $dp[i+1]=dp[i]+1+(1-\alpha)*(1-\beta)*(dp[i+1]-dp[i])+(1-\alpha)*\beta*dp[i+1])$ 得:
$dp[i+1]=\frac{AB+dp[i]*\sum_{前t小}{\alpha+\beta-\alpha*\beta}}{t-\sum_{前t小}{1-\alpha}}$ .
然后枚举递推就可以了，时间复杂度 $O (k * A * B)$

code:

struct Node {
    int a, b;
    double val;
    bool operator < (const Node &q) const {
        return val < q.val;
    } 
}q[N];
void solve() {
    int k, A, B;
    cin >> k >> A >> B;
    vector<double> f(k + 1, 0);
    int tot = 0;
    for(int i = 0; i < A; i++)
        for(int j = 0; j < B; j++) {
            tot++;
            q[tot] = {i, j};
            if(i) q[tot].val = 1.0 * (A * j - i * j) / (i * B);
            else q[tot].val = 1e18;
        }
    sort(q + 1, q + 1 + tot);    
    for(int i = 0; i < k; i++) {
        f[i + 1] = 1e20;
        double s1 = 0, s2 = 0;
        for(int j = 1; j <= tot; j++) {
            s1 += 1.0 * q[j].a / A + 1.0 * q[j].b / B - 1.0 * q[j].a / A * q[j].b / B;
            s2 += 1 - 1.0 * q[j].a / A;
            f[i + 1] = min(f[i + 1], 1.0 * (A * B + f[i] * s1) / (j - s2));
        }
    }
    // for(int i = 0; i <= k; i++) D(f[i]);
    printf("%.3lf\n", f[k]);

}