【概率/期望】【DP】NOIP2016换教室

这篇博客回顾了NOIP2016中的一道概率DP题目,作者发现之前的暴力解法效率低下,并给出了优化后的DP解决方案。博客详细解释了状态转移方程,讨论了如何根据前一节课的状态来计算当前状态的最小期望代价。通过枚举申请结果并乘以相应概率,得出最终答案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分析:

重做自己以前考过的题。。。

突然有种成长的感觉。。。(觉得以前的自己就是个智障)

这么水的概率DP题。。。放CFDiv1里面顶多也就B题的位置。。。我当年居然写的暴力。。。

dp定义很简单,转移也很简单

DP[i][j][0/1]DP[i][j][0/1]表示前i节课,申请了j次换课的最小期望代价,因为代价是要基于i-1位置的,所以要加一维表示当前这一节课有没有申请。

然后
DP[i][j][0]=min{DP[i1][j][0]+dist(ci1,ci),DP[i1][j][1]+dist(ci1,ci)(1ki1)+dist(di1,ci)ki1}DP[i][j][0]=min{DP[i−1][j][0]+dist(ci−1,ci),DP[i−1][j][1]+dist(ci−1,ci)∗(1−ki−1)+dist(di−1,ci)∗ki−1}

DP[i][j][1]=min{DP[i1][j1][0]+dist(ci1,ci)(1ki)+dist(ci1,di)ki,DP[i1][j1][1]+dist(ci1,ci)(1ki1)(1ki)+dist(ci1,di)(1ki1)ki+dist(di1,ci)ki1(1ki)+dist(di1,di)ki1ki}DP[i][j][1]=min{DP[i−1][j−1][0]+dist(ci−1,ci)∗(1−ki)+dist(ci−1,di)∗ki,DP[i−1][j−1][1]+dist(ci−1,ci)∗(1−ki−1)∗(1−ki)+dist(ci−1,di)∗(1−ki−1)∗ki+dist(di−1,ci)∗ki−1∗(1−ki)+dist(di−1,di)∗ki−1∗ki}

似乎是有点长哈。。不过其实挺简单的,就是手动枚举这两个点的申请结果,再乘以对应概率。

答案就是min{DP[n][i][0/1]}(i[0,m])min{DP[n][i][0/1]}(i∈[0,m])

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#define SF scanf
#define PF printf
#define MAXN 2010
#define MAXM 310
#define INF 1000000000
using namespace std;
double dp[MAXN][MAXN][2];
int dist[MAXM][MAXM],n,m,v,e;
int c[MAXN],d[MAXN];
double k[MAXN];
int main(){
    SF("%d%d%d%d",&n,&m,&v,&e);
    for(int i=1;i<=n;i++)
        SF("%d",&c[i]);
    for(int i=1;i<=n;i++)
        SF("%d",&d[i]);
    for(int i=1;i<=n;i++)
        SF("%lf",&k[i]);
    memset(dist,0x3f3f3f3f,sizeof dist);
    for(int i=1;i<=v;i++)
        dist[i][i]=0;
    int x,y,val;
    for(int i=1;i<=e;i++){
        SF("%d%d%d",&x,&y,&val);
        dist[x][y]=min(dist[x][y],val);
        dist[y][x]=dist[x][y];
    }
    for(int l=1;l<=v;l++)
        for(int i=1;i<=v;i++)
            for(int j=1;j<=v;j++)
                dist[i][j]=min(dist[i][j],dist[i][l]+dist[l][j]);
    for(int i=0;i<=n;i++)
        for(int j=0;j<=m;j++)
            dp[i][j][0]=dp[i][j][1]=INF;
    dp[1][0][0]=0;
    dp[1][1][1]=0;
    for(int i=2;i<=n;i++)
        for(int j=0;j<=i;j++){
            dp[i][j][0]=min(dp[i-1][j][0]+dist[c[i-1]][c[i]],dp[i-1][j][1]  +  dist[c[i-1]][c[i]]*(1-k[i-1])  +dist[d[i-1]][c[i]]*k[i-1]);
            if(j>0)
                dp[i][j][1]=dp[i-1][j-1][0]  +  dist[c[i-1]][d[i]]*k[i]  +  dist[c[i-1]][c[i]]*(1-k[i]);
            if(j>1)
                dp[i][j][1]=min(dp[i][j][1],dp[i-1][j-1][1]  +  dist[c[i-1]][c[i]]*(1-k[i])*(1-k[i-1])  +  dist[c[i-1]][d[i]]*k[i]*(1-k[i-1])  +  dist[d[i-1]][c[i]]*k[i-1]*(1-k[i])  +  dist[d[i-1]][d[i]]*k[i]*k[i-1]);
        }
    double ans=INF;
    for(int i=0;i<=m;i++)
        ans=min(ans,min(dp[n][i][0],dp[n][i][1]));
    PF("%.2lf",ans);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值