[NOIP2016] 换教室

本文介绍了一道经典的NOIP概率DP题目,通过概率DP与Floyd算法结合解决学生选课过程中教室更换的问题,旨在寻找最优策略以最小化学生在不同教室间移动的体力消耗。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NOIP历史上第一道期望题,貌似坑了许多学长啊。


Description

对于刚上大学的牛牛来说,他面临的第一个问题是如何根据实际情况申请合适的课程。
在可以选择的课程中,有2n节课程安排在n个时间段上。在第i(1≤i≤n)个时间段上,两节内容相同的课程同时在不同的地点进行,其中,牛牛预先被安排在教室ci上课,而另一节课程在教室di进行。在不提交任何申请的情况下,学生们需要按时间段的顺序依次完成所有的n节安排好的课程。
如果学生想更换第i节课程的教室,则需要提出申请。若申请通过,学生就可以在第i个时间段去教室di上课,否则仍然在教室ci上课。由于更换教室的需求太多,申请不一定能获得通过。
通过计算,牛牛发现申请更换第i节课程的教室时,申请被通过的概率是一个已知的实数ki,并且对于不同课程的申请,被通过的概率是互相独立的。学校规定,所有的申请只能在学期开始前一次性提交,并且每个人只能选择至多m节课程进行申请。这意味着牛牛必须一次性决定是否申请更换每节课的教室,而不能根据某些课程的申请结果来决定其他课程是否申
请;牛牛可以申请自己最希望更换教室的m门课程,也可以不用完这m个申请的机会,甚至可以一门课程都不申请。因为不同的课程可能会被安排在不同的教室进行,所以牛牛需要利用课间时间从一间教室赶到另一间教室。
牛牛所在的大学有v个教室,有e条道路。每条道路连接两间教室,并且是可以双向通行的。由于道路的长度和拥堵程度不同,通过不同的道路耗费的体力可能会有所不同。当第i(1≤i≤n-1)节课结束后,牛牛就会从这节课的教室出发,选择一
条耗费体力最少的路径前往下一节课的教室。
现在牛牛想知道,申请哪几门课程可以使他因在教室间移动耗费的体力值的总和的期望值最小,请你帮他求出这个最小值。

Input

第一行四个整数n,m,v,e。n表示这个学期内的时间段的数量;m表示牛牛最多可以申请更换多少节课程的教室;v表示牛牛学校里教室的数量;e表示牛牛的学校里道路的数量。
第二行n个正整数,第i(1≤i≤n)个正整数表示c,,即第i个时间段牛牛被安排上课的教室;保证1≤ci≤v。
第三行n个正整数,第i(1≤i≤n)个正整数表示di,即第i个时间段另一间上同样课程的教室;保证1≤di≤v。
第四行n个实数,第i(1≤i≤n)个实数表示ki,即牛牛申请在第i个时间段更换教室获得通过的概率。保证0≤ki≤1。
接下来e行,每行三个正整数aj,bj,wj,表示有一条双向道路连接教室aj,bj,通过这条道路需要耗费的体力值是Wj;
保证1≤aj,bj≤v,1≤wj≤100。
保证1≤n≤2000,0≤m≤2000,1≤v≤300,0≤e≤90000。
保证通过学校里的道路,从任何一间教室出发,都能到达其他所有的教室。
保证输入的实数最多包含3位小数。

Output

输出一行,包含一个实数,四舎五入精确到小数点后恰好2位,表示答案。你的
输出必须和标准输出完全一样才算正确。
测试数据保证四舎五入后的答案和准确答案的差的绝对值不大于4*10^-3。(如果你不知道什么是浮点误差,这段话可以理解为:对于大多数的算法,你可以正常地使用浮点数类型而不用对它进行特殊的处理)

Sample Input

3 2 3 3
2 1 2
1 2 1
0.8 0.2 0.5
1 2 5
1 3 3
2 3 1

Sample Output

2.80

样例解释

样例解释

数据范围及提示

参见 题目链接


正解: 概率DP+Floyd。
第一次写概率DP,转移方程写了好久,竟然一遍过了。
显然此题可以分为当前课 换/不换 两种情况:

1、当前课换
 1) 成功
    a.上节课换了(成功/不成功)
    b.上节课没换
 2) 失败
    a.上节课换了(成功/不成功)
    b.上节课没换
2、当前课不换
 1) 上节课也没换
 2) 上节课换了(成功/不成功)

那么我们就可以设f[i][j][0/1]表示第i个时间段换过j次教室,第i个时间段不换/换教室的体力值期望最小值。
初值:f[1][0][0]=0, f[1][1][1]=0, f[i][0][0]=f[i-1][0][0]+dis[a[i-1]][a[i]]
边界:i=2..n, j=1..min(i,m)
“易”得方程:


f[i][j][0] = min(f[i-1][j][0] + dis[c[i-1]][c[i]],
        f[i-1][j][1] + k[i-1]*dis[d[i-1]][c[i]] + (1.0-k[i-1])*dis[c[i-1]][c[i]]);
f[i][j][1] = min(f[i-1][j-1][0] + k[i]*dis[c[i-1]][d[i]] + (1.0-k[i])*dis[c[i-1]][c[i]],
        f[i-1][j-1][1] + k[i-1]*k[i]*dis[d[i-1]][d[i]] + (1.0-k[i-1])*k[i]*dis[c[i-1]][d[i]] + k[i-1]*(1.0-k[i])*dis[d[i-1]][c[i]] + (1.0-k[i-1])*(1.0-k[i])*dis[c[i-1]][c[i]]);

输出:min(F[n][i][0], F[n][i][1]) i=1..m

代码:

#include<iostream>
#include<cstdio>
using namespace std;
int N, M, V, E, A[2010], B[2010], H[310][310];
double P[2010], F[2010][2010][2];
void Init(){
    scanf("%d %d %d %d", &N, &M, &V, &E);
    for(int i = 1; i <= N; i++) scanf("%d", &A[i]);
    for(int i = 1; i <= N; i++) scanf("%d", &B[i]);
    for(int i = 1; i <= N; i++) scanf("%lf", &P[i]);
    for(int i = 0; i <= V; i++){
        for(int j = 0; j <= V; j++){
            if(i == j)  H[i][j] = 0;
            else H[i][j] = 1e9;
        }
    }
    for(int i = 1, u,v,w; i <= E; i++){
        scanf("%d %d %d", &u, &v, &w);
        if(u == v)  continue;
        H[u][v] = H[v][u] = min(w,H[u][v]);
    }
    for(int i = 0; i <= N; i++){
        for(int j = 0; j <= N; j++){
            F[i][j][0] = F[i][j][1] = 1e9;
        }
    }
    F[1][0][0] = 0; F[1][1][1] = 0;
}
void Floyd(){
    for(int k = 1; k <= V; k++){
        for(int i = 1; i <= V; i++){
            for(int j = 1; j <= V; j++){
                H[i][j] = min(H[i][j], H[i][k]+H[k][j]);
            }
        }
    }
}
void DP(){
    for(int i = 2; i <= N; i++){
        F[i][0][0] = F[i-1][0][0] + H[A[i-1]][A[i]];
        for(int j = 1; j <= min(i,M); j++){
            int aa=H[A[i-1]][A[i]], ab=H[A[i-1]][B[i]];
            int bb=H[B[i-1]][B[i]], ba=H[B[i-1]][A[i]];
            F[i][j][0] = 
                    min(F[i-1][j][0] + aa,
                       F[i-1][j][1] + P[i-1]*ba + (1.0-P[i-1])*aa);
            F[i][j][1] = 
                    min(F[i-1][j-1][0] + P[i]*ab + (1.0-P[i])*aa,
                       F[i-1][j-1][1] + P[i-1]*P[i]*bb + (1.0-P[i-1])*P[i]*ab + P[i-1]*(1.0-P[i])*ba + (1.0-P[i-1])*(1.0-P[i])*aa);
        }
    }
}
int main()
{
    Init();
    Floyd();
    DP();
    double ans = F[N][0][0];
    for(int i = 1; i <= M; i++){
        ans = min(ans, min(F[N][i][0], F[N][i][1]));
    }
    printf("%.2lf", ans);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值