The Moon 【HDU - 6558】【期望DP】

本文介绍了一种通过动态规划算法解决游戏轮数期望问题的方法。游戏中玩家每轮胜利后概率会变化,目标是计算获得玩具平均需要多少轮。文章详细解释了递推公式的推导过程,并提供了一个C++实现的代码示例。

题目链接

题目大意

有一个游戏分为4步
1.初始概率q=2%;
2.玩家一轮游戏赢的概率为p,如果他这轮赢了,将进入步骤3,否则进去步骤4
3.玩家有q的概率得到一个玩具,如果得到玩具,游戏结束,如果没有得到玩具就让q变为
min(100,q+2%);
4.让q变为min(100,q+1.5%);
问游戏轮数的期望

解题思路

这个题的递推公式还是简单的,一共有三种情况,要么拿到玩具结束,要么让q+2%,要么让q+1.5%
我乘了10,因为有小数
dp[i]+=q*p;
dp[i]+=(1.0-q) * (dp[min(1000,i+20)]+1.0) * p;
dp[i]+=(1.0-p) * (dp[min(1000,i+15)]+1.0);
注意超出的地方应该根据题意写。
比赛的时候公式很早就推出来了,让我难受的是初始化,dp[1000]应该是1/p
因为如果进行n次,前n-1次都失败,第n次成功,符合几何分布。

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
double dp[10000];
double p;
int main()
{
    int T,pp=1;
    scanf("%d",&T);
    while(T--)
    {
        int P;
        scanf("%d",&P);
        p=(double)P/100.0;
        memset(dp,0,sizeof(dp));
//        for(int i=1005;i<=1015;i++)
//            dp[i]=1;
dp[1000]=1/p;
        for(int i=999; i>=20; i--)
        {
            double q=(double)i/(double)1000;
            dp[i]+=q*p;
            dp[i]+=(1.0-q)*(dp[min(1000,i+20)]+1.0)*p;
            dp[i]+=(1.0-p)*(dp[min(1000,i+15)]+1.0);
        }
        printf("Case %d: ",pp++);
        printf("%.10f\n",dp[20]);
    }
    return 0;
}
### 关于HDU - 6609 的题目解析 由于当前未提供具体关于 HDU - 6609 题目的详细描述,以下是基于一般算法竞赛题型可能涉及的内容进行推测和解答。 #### 可能的题目背景 假设该题目属于动态规划类问题(类似于多重背包问题),其核心在于优化资源分配或路径选择。此类问题通常会给出一组物品及其属性(如重量、价值等)以及约束条件(如容量限制)。目标是最优地选取某些物品使得满足特定的目标函数[^2]。 #### 动态转移方程设计 如果此题确实是一个变种的背包问题,则可以采用如下状态定义方法: 设 `dp[i][j]` 表示前 i 种物品,在某种条件下达到 j 值时的最大收益或者最小代价。对于每一种新加入考虑范围内的物体 k ,更新规则可能是这样的形式: ```python for i in range(n): for s in range(V, w[k]-1, -1): dp[s] = max(dp[s], dp[s-w[k]] + v[k]) ``` 这里需要注意边界情况处理以及初始化设置合理值来保证计算准确性。 另外还有一种可能性就是它涉及到组合数学方面知识或者是图论最短路等相关知识点。如果是后者的话那么就需要构建相应的邻接表表示图形结构并通过Dijkstra/Bellman-Ford/Floyd-Warshall等经典算法求解两点间距离等问题了[^4]。 最后按照输出格式要求打印结果字符串"Case #X: Y"[^3]。 #### 示例代码片段 下面展示了一个简单的伪代码框架用于解决上述提到类型的DP问题: ```python def solve(): t=int(input()) res=[] cas=1 while(t>0): n,k=list(map(int,input().split())) # Initialize your data structures here ans=find_min_unhappiness() # Implement function find_min_unhappiness() res.append(f'Case #{cas}: {round(ans)}') cas+=1 t-=1 print("\n".join(res)) solve() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值