【数学期望】期望dp

最新推荐文章于 2024-11-03 10:20:27 发布

原创

最新推荐文章于 2024-11-03 10:20:27 发布 · 1.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#期望 #递推

这篇博客主要介绍了如何使用期望动态规划（dp）解决一系列问题，通过递推方式解析并给出多个例题的详细解答和代码实现，包括抛硬币问题、利润预期、涂格子问题等，展示如何进行期望的顺推与逆推。

参考博客: https://www.zybuluo.com/zsh-o/note/1175045
此类问题，一般用递推的思想去考虑比较简单。跟普通的dp差不多，前面的子问题可以重复使用。
在这里插入图片描述

例题1

https://ac.nowcoder.com/acm/contest/697/A

题解

这个题其实就是抛硬币连续k次正面的变形。
在还没看博客之前做着题的时候，我想的是，走到第i个点需要1秒的期望，2秒的期望，3秒的期望，4秒的期望。。。。。
会发现这个根本就不可做。如果每颗雷的概率相同的话，还能用错位相减推出通项公式。

可以采用递推的方式:
f[i] : 成功排掉第i颗雷所需的期望时间
递推关系：
$\frac{a_i}{b_i}(f[i-1]+1)+(1-\frac{a_i}{b_i})(f[i-1]+1+f[i])$
成功排掉第i颗雷+不成功需要重新排
化简之后
$\frac{b_i}{a_i}(f[i-1]+1)$

代码

#include <bits/stdc++.h>
using namespace std;
// f[i] : 成功排掉第i个雷的期望时间
// f[i] = a/b*(f[i-1]+1)+(1-a/b)*(f[i-1]+1+f[i])
// f[i] = b/a*(f[i-1]+1);
const int mod = 1e9+7;
const int maxn = 1e6+5;
typedef long long ll;
ll pw(ll x, ll n) {
   
   
    ll ret = 1;
    while(n) {
   
   
        if(n&1) ret = ret*x%mod;
        x = x*x%mod;
        n >>= 1;
    }
    return ret;
}
ll f[maxn];

int main() {
   
   
    int n;
    scanf("%d",