HDU 4405 期望DP

本文介绍了一个经典的期望DP问题:通过掷骰子在特殊连接的格子上前进,并求解达到终点或超出终点所需的期望掷骰子次数。文章详细解析了从后向前推进的DP方法,并给出了具体实现代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

期望DP算是第一题吧...虽然巨水但把思路理理清楚总是好的。。

题意:在一个1×n的格子上掷色子,从0点出发,掷了多少前进几步,同时有些格点直接相连,即若a,b相连,当落到a点时直接飞向b点。求走到n或超出n期望掷色子次数


SOL:

    期望DP还是显然的,从后往前推也是显然的——这个题目能比较好地理解为什么要从后往前推。概率DP每个状态都在当前已知的概率下推出——最基本事件的概率往往都是已知的,而期望不同,从头开始,头的期望步数是根本不可知的,一旦遇上不可行状态极难处理,而从后往前推,最后一个状态的期望一般均为0,而它是由在它之前的状态转移而来,那么前面状态就可以更新了——

    ——例如本题,E[i]表示从第i个格子到第n个格子的期望步数,那么dp[n]显然等于0,而对于第i个点,它下一步可能的方向是i+1~6,那么根据概率的那什么公式累加已推出的点乘上概率——因为转移是要掷色子的所以还要再加上一。

   然而对于直接相连的两个点怎么考虑呢,对于相对位置靠前的那个点——它只能到下一个点,那么它的期望直接就传过来了。。连加一都不需要...所以期望&概率题需要考虑清楚状态之间的关系——保证DP的正确。


code:

#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <cstring>
#define ll long long
double dp[100005];
int vis[100005];

int main()
{
    int n,m;
    while(scanf("%d%d",&n,&m)!=EOF){
        if((n+m)==0)break;
        memset(vis,-1,sizeof(vis));
        for(int i=1;i<=m;i++){
            int a,b;
            scanf("%d%d",&a,&b);
            vis[a]=b;
        }
        memset(dp,0,sizeof(dp));
        for(int i=n-1;i>=0;i--){
            if(vis[i]==-1){
                for(int j=1;j<=6;j++){
                    dp[i]+=dp[i+j]/6.0;
                }
                dp[i]+=1;
            }
            else
                 dp[i]=dp[vis[i]];
        }
        printf("%.4lf\n",dp[0]);
    }
    return 0;
}


### 数位 DP 算法详解 数位 DP 是一种基于动态规划的思想来解决特定计数问题的方法。它通过将数字分解成各个数位(如个位、十位等),并利用记忆化搜索的方式快速统计某个范围内满足某些条件的数字的数量。 #### 基本概念 数位 DP 主要用于解决如下形式的问题:给定一个闭区间 $[L, R]$,求该区间内满足某种条件的整数数量[^1]。为了高效解决问题,通常会采用 **记忆化搜索** 或者 **状态转移方程** 来减少重复计算的时间复杂度。 --- #### 核心思想 数位 DP 的核心在于将其转化为对每一位上的数值进行处理,并记录中间结果以便后续重用。以下是其主要特点: - 将数字按位拆分,逐位分析。 - 使用 DFS 配合记忆化数组存储子问题的结果。 - 利用前缀性质优化时间复杂度。 具体来说,在实现过程中需要考虑以下几个维度的状态变量: 1. 当前正在处理哪一位(`pos`); 2. 是否受到上界约束(即当前数字是否等于上限 `R` 的对应位置值,记作 `limit`); 3. 是否受下界约束(同理可定义为 `lower_limit`,但在实际应用中较少涉及); 4. 已经构建的部分是否满足题目中的特殊条件(比如不包含连续两位相同的情况或其他限制条件)。 这些状态共同构成了递归函数的核心参数列表[^2]。 --- #### 实现方法 下面是一个通用的数位 DP 模板: ```cpp #include <bits/stdc++.h> using namespace std; // 定义全局变量 int dp[20][state_size]; // 记忆化数组 vector<int> num; // 存储目标数字的各位表示 // dfs 函数原型 long long dfs(int pos, int state, bool limit); // 初始化入口函数 long long solve(long long x) { num.clear(); while (x > 0) { // 将数字转为逆序存储的形式 num.push_back(x % 10); x /= 10; } reverse(num.begin(), num.end()); memset(dp, -1, sizeof(dp)); // 清空记忆化缓存 return dfs(0, initial_state, true); // 开始递归调用 } // 具体的dfs逻辑 long long dfs(int pos, int state, bool limit) { if (pos == num.size()) return check(state); // 边界情况判断 if (!limit && dp[pos][state] != -1) return dp[pos][state]; int up = limit ? num[pos] : 9; // 如果有限制,则取较小值作为上限;否则可以达到最大可能值9 long long res = 0; for (int i = 0; i <= up; ++i) { int new_state = update(state, i); // 更新状态机 if (valid(new_state)) { // 只有合法的新状态才继续向下扩展 res += dfs(pos + 1, new_state, limit && (i == up)); } } if (!limit) dp[pos][state] = res; // 缓存无限制下的结果 return res; } ``` 上述代码展示了如何设计一个基础框架来进行数位 DP 的操作。其中需要注意的关键点包括但不限于以下几点: - 如何初始化输入数据以及转换为目标格式; - 设计合适的状态空间大小 (`state_size`) 和初始状态 (`initial_state`); - 明确哪些条件下允许进入下一步迭代(`check`, `update`, and `valid`); --- #### 应用实例 以 HDU-2089 “不要62”为例说明其实现过程。此题要求找出 `[l, r]` 范围内的所有不含字符串 `"62"` 的正整数总数。 ##### 解决方案 我们可以先分别算出从零到右端点 `r` 中符合条件的数目再减去同样规则作用于左端点左边区域所得值即可得出最终答案。 ```cpp bool valid(string s){ string t="62"; if(s.find(t)!=string::npos)return false; return true; } ``` 这里省略了完整的程序清单但由于遵循之前提到的标准模式所以应该很容易理解整个流程是如何运作起来的[^3]。 --- ### 总结 通过对数位 DP 技巧的学习可以看出这是一种非常有效的手段用来应对那些单纯依靠暴力穷举无法胜任的大规模查询请求场景。只要掌握了基本原理加上灵活运用就能轻松搞定许多看似复杂的难题啦!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值