【bzoj1415】【聪聪和可可】期望dp(记忆化搜索)+最短路

本文探讨了一种基于期望动态规划解决猫鼠游戏问题的方法。通过定义状态f[i][j]为猫在i点老鼠在j点时的期望步数,并采用记忆化搜索的方式进行递推,最终求解出猫捕捉到老鼠所需的期望步数。

这里写图片描述
[pixiv] https://www.pixiv.net/member_illust.php?mode=medium&illust_id=57148470
Descrition
这里写图片描述

首先很明显是期望dp。但是如何进行转移呢?
对于dp,什么样的状态容易储存呢?怎样又分解成相应的子问题呢?于是发现,对于这个问题,我们需要知道猫的位置到老鼠位置的期望值。与这样的相似的状态有很多。观察数据范围,是可以用二维数组存下的。所以我们用f[i][j]表示猫在i点,老鼠在j点的答案。

转移方程:
f[i][j]=sigma(f[i’][j’]*1/(degree[j]+1))+1
i’表示猫在i会移动到的下一个景点(因为是猫先动,所以i’可以直接算出来),j’表示j的后继状态们(老鼠可以到达的点和当前点)

然而对于这样的方程要怎么递推呢?死都没想出来。直到看了网上的题解才想起dp还有记忆化搜索的类型。

对于如何在已知猫和老鼠的位置,确定猫的下一步走法?用最短路就好了,顺带处理一下d[i][j]的值(表示猫在i老鼠在j的猫的下一步)。我比较喜欢用spfa

#include<queue>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
 
const int N=1000+5;
 
int n,e,st,ed;
int p[N][N],dis[N],deg[N];
double f[N][N];
bool exi[N];
int head[N],end[N*2],nxt[N*2],hh=0;
priority_queue<pair<int,int>,vector<pair<int,int> >,greater<pair<int,int> > > q;
 
void adde(int a,int b){
    hh++;
    end[hh]=b;
    nxt[hh]=head[a];
    head[a]=hh;
}
void spfa(int x){
    memset(dis,0x3f,sizeof(dis));
    memset(exi,0,sizeof(exi));
    while(!q.empty()) q.pop();
    p[x][x]=x;
    dis[x]=0;
    for(int i=head[x];i;i=nxt[i]){
        int v=end[i];
        p[x][v]=v;
        dis[v]=1;
        q.push(make_pair(1,v));
        exi[v]=1;
    }
    while(!q.empty()){
        int u=q.top().second;q.pop();
        exi[u]=0;
        for(int i=head[u];i;i=nxt[i]){
            int v=end[i];
            if(dis[v]>=dis[u]+1){
                if(dis[v]==dis[u]+1) p[x][v]=min(p[x][u],p[x][v]);
                else p[x][v]=p[x][u];
                dis[v]=dis[u]+1;
                if(!exi[v]){
                    q.push(make_pair(dis[v],v));
                    exi[v]=1;
                }
            }
        }
    }
}
double dfs(int cat,int mice){
    if(f[cat][mice]!=-1) return f[cat][mice];
    if(p[p[cat][mice]][mice]==mice) return f[cat][mice]=1;
    double ans=0;
    int cc=p[p[cat][mice]][mice];
    for(int i=head[mice];i;i=nxt[i]){
        int v=end[i];
        if(v==cc) continue;
        ans+=dfs(cc,v)/(deg[mice]+1);
    }
    ans+=dfs(cc,mice)/(deg[mice]+1)+1;
    return f[cat][mice]=ans;
}
int main(){
    scanf("%d%d%d%d",&n,&e,&st,&ed);
    int a,b;
    for(int i=1;i<=e;i++){
        scanf("%d%d",&a,&b);
        adde(a,b),adde(b,a);
        deg[a]++,deg[b]++;
    }
    for(int i=1;i<=n;i++) spfa(i);
    for(int i=1;i<=n;i++)
        for(int j=1;j<=n;j++) f[i][j]=-1;
    printf("%.3lf\n",dfs(st,ed));
    return 0;
}
题目描述 有一个 $n$ 个点的棋盘,每个点上有一个数字 $a_i$,你需要从 $(1,1)$ 走到 $(n,n)$,每次只能往右或往下走,每个格子只能经过一次,路径上的数字为 $S$。定义一个点 $(x,y)$ 的权值为 $a_x+a_y$,求所有满足条件的路径中,所有点的权值小值。 输入格式 第一行一个整数 $n$。 接下来 $n$ 行,每行 $n$ 个整数,表示棋盘上每个点的数字。 输出格式 输出一个整数,表示所有满足条件的路径中,所有点的权值小值。 数据范围 $1\leq n\leq 300$ 输入样例 3 1 2 3 4 5 6 7 8 9 输出样例 25 算法1 (树形dp) $O(n^3)$ 我们可以先将所有点的权值求出来,然后将其看作是一个有权值的图,问题就转化为了在这个图中求从 $(1,1)$ 到 $(n,n)$ 的所有路径中,所有点的权值小值。 我们可以使用树形dp来解决这个问题,具体来说,我们可以将这个图看作是一棵树,每个点的父节点是它的前驱或者后继,然后我们从根节点开始,依次向下遍历,对于每个节点,我们可以考虑它的两个儿子,如果它的两个儿子都被遍历过了,那么我们就可以计算出从它的左儿子到它的右儿子的路径中,所有点的权值小值,然后再将这个值加上当前节点的权值,就可以得到从根节点到当前节点的路径中,所有点的权值小值。 时间复杂度 树形dp的时间复杂度是 $O(n^3)$。 C++ 代码 算法2 (动态规划) $O(n^3)$ 我们可以使用动态规划来解决这个问题,具体来说,我们可以定义 $f(i,j,s)$ 表示从 $(1,1)$ 到 $(i,j)$ 的所有路径中,所有点的权值为 $s$ 的小值,那么我们就可以得到如下的状态转移方程: $$ f(i,j,s)=\min\{f(i-1,j,s-a_{i,j}),f(i,j-1,s-a_{i,j})\} $$ 其中 $a_{i,j}$ 表示点 $(i,j)$ 的权值。 时间复杂度 动态规划的时间复杂度是 $O(n^3)$。 C++ 代码
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值