浅谈期望dp

最新推荐文章于 2025-06-15 18:04:51 发布

转载最新推荐文章于 2025-06-15 18:04:51 发布 · 750 阅读

4 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/ve-2021/p/11054891.html

博客主要探讨了期望dp需要倒推的原因。以每个格子可向左右、下或原地不动为例，若正序推式子，当前状态值由四个位置状态值得到，概率和期望难以求解。而将状态设置为从某点到最后一行，倒序求式子，能使后续位置和概率更好计算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天解决了一直以来的一个疑问：

为什么期望dp需要倒推？

参考：传送门

例题：传送门

每个格子可以向左右或向下或原地不动。

假如正序推式子：

且dp设置成从(x,y)到(i,j)的期望值，那么：

当前状态的值将由这四个位置的状态值得到，那么概率怎么求？？？

这四个位置到当前状态的概率可不是1/4。。。

那么对应的期望也不是很好办。

期望，状态设置应保证已知最终状态如何表示。

我们这里将f[i][j]表示为从(i,j)到最后一行的状态，这样最终答案也确定为f[x][y].

继续看转移：

从当前点向后转移时，具体得到哪几个位置和概率就很好算了。

这样的话f[i][j] = 1/4*(f[i+1][j]+f[i][j]+f[i][j+1]+f[i][j-1]);

我们需要倒序求式子，使每次到当前行时，f[i+1][j]作为常数参与消元。

emmm...

没了。

再有一些感触会加以补充的。

转载于:https://www.cnblogs.com/ve-2021/p/11054891.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34220834

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

期望dp小结

风雨兼程

10-31

1443

前言：期望dp状态的定义是较为显然的，但对于状态的转移往往需要一些公式的推导。关键的几点是状态之间的互通性，和状态转移的花费，以及转移的概率解决期望dp的几个技巧如下：一.利用期望的线性性质：E[X+Y]=E[X]+E[Y]E[X+Y]=E[X]+E[Y] 我们所求的期望可以化为多个步骤的期望累和相关题目:J,L二.采用逆序的方式：在目标确定的情况下，可以得知在目标到达目标的期望值为0，然后根

浅谈概率与期望 DP

Monica

09-11

1589

概率与期望DP，一直都不会啊，感觉好难完全没法思考…期望题一般是逆推，当然也有一些是顺推，然而现在我只做过一些水得很的期望题，好菜啊…UVa 11021 麻球繁衍蓝书p140题解：现在有k只麻球，每只麻球都只能活一天，但是可能会在死前爆出0到n-1值麻球，几率分别为p0,p1,p2...pn−1p_0,p_1,p_2...p_{n-1}，求m天后所有麻球都死了的概率，因为每只麻球是独立的，这只麻球

参与评论您还未登录，请先登录后发表或查看评论

poj 2096 Collecting Bugs（期望 dp 概率推导分类讨论）

dielucuan8830的博客

09-09

100

Description Ivan is fond of collecting. Unlike other people who collect post stamps, coins or other material stuff, he collects software bugs. When Ivan gets a new program, he classifies all...

概率期望DP

最新发布

2401_90042730的博客

06-15

490

骰子爬楼梯问题：设EiE[i]Ei为从第iiiEi116Ei1Ei2⋯Ei6inEn0Ei161Ei1Ei2⋯Ei6])inEn0赌徒破产问题dpip⋅dpi11−p⋅dpi−1dp00dpN1dpip⋅dpi11−p⋅dpi−1dp00dpN1。

数学期望dp

weixin_42165786的博客

04-13

1149

dp求数学期望时往往是在上一个状态求完期望后，加上新状态的要求再求期望,但每次求dp时所乘的所有概率要等于1 https://www.cnblogs.com/hua-dong/p/8166093.html 数学期望 P=Σ每一种状态*对应的概率。因为不可能枚举完所有的状态，有时也不可能枚举完，比如抛硬币，有可能一直是正面，etc。在没有接触数学期望时看到数学期望的题可能会觉得很阔怕（因为我...

期望DP

Komachi's Blog

10-31

585

联赛前继续刷DP，RTT1 M期望DP推公式的一个套路题。定义FiF_i为从ii点开始到逃脱的期望步数。那么可得 Fi=ki∗(1+F1)+0∗ei+1Degi∑(1+Fj)((i,j)∈E)F_i=k_i*(1+F_1)+0*e_i+\frac{1}{Deg_i}\sum(1+F_j)((i,j)\in E) Fi=1+ki∗F1+1Degi∑FjF_i=1+k_i*F_1+\frac

BZOJ 4318 浅谈期望运算性质及期望动态规划

BerryKanry的博客

08-11

1728

世界真的很大期望是一个数学上的概念，不知哪个天才想到了用程序来处理这玩意儿，发现期望有递推的性质期望DP就诞生了。。刚开始学还是很毒瘤的，切记不要想多了期望大概就是答案对概率的加权平均数，就是说综合所有情况及各个的概率的答案的平均值说白了就是考试你估计你能得多少分看题先： descriptionosu 是一款群众喜闻乐见的休闲软件。我们可以把osu的规则简化与改编成以

浅谈DP、MC、TD方法的区别与联系

qq_36013249的博客

05-01

4820

引言 Dynamic Programming, Monte Carlo, Temporal Difference是强化学习过程中最基础的三种算法，本文主要总结一下这三种方法的区别与联系；强化学习模型本质上是一个随机过程，可以用概率图模型来描述，就像 HMM 可以使用有向图来描述，马尔可夫网可以使用无向图来描述，强化学习对应的图模型是Finite Markov Decision Process（...

CodeForces 280C 浅谈期望线性性的树上问题实际运用

BerryKanry的博客

08-13

713

世界真的很大期望这么个东西还是很厉害的其中很重要的一条性质就是期望的线性性，这个直接决定了期望问题可以分解并且递推处理，也直接决定了期望这种东西能和DP扯上关系期望可以等于所有基本情况的发生概率x等价的值之和看题先： description：给出一棵含n个白点的有根树,每次随机选择一个还没有被染黑的节点,将这个节点和这个节点子树中的所有点染黑. 问期望操作多少次后所有点都被染黑.

浅谈期望的线性性（可加性）【CodeForces280c】【bzoj3036】【bzoj3143】

LinnBlanc的博客

09-14

5042

[pixiv] https://www.pixiv.net/member_illust.php?mode=medium&illust_id=63399955 向大(hei)佬(e)势力学(di)习(tou)之前一直都没有接触过期望，更别说期望dp了。先从期望说起吧，dp什么的先不谈。浅谈一下期望的线性性（可加性），这是一个很重要的性质，主要用我做的这几道例题来更感性的理解（真的是浅谈。。。o

动态规划-简单了解下什么是期望DP

estiny_123123的博客

02-16

2642

在期望DP中，我们将问题转化为求解状态的期望值，而不仅仅是状态的具体值。通过定义状态和状态转移方程，我们可以递推计算得到状态的期望值，从而求解问题。在许多问题中，我们不仅关心某个状态的具体值，还关心该状态的期望值，即在多次实验中，该状态的平均值。那么我们可以得到 dp[n][m]=0 ，因为已经达到了目标状态，所以我们可以倒推，我们要求的答案就是 dp[0][0]。令 dp[i][j] 为小蓝已经玩过 i 种职业，j个阵营之后，达到最终状态的期望天数。这里的最终状态是玩遍所有的职业与阵营。

期望与期望dp/概率dp

weixin_43602607的博客

09-16

719

关于期望期望的两个公式：通用公式： ∑pi×vi\sum p_i\times v_i∑pi×vi，pi 为概率，vi 为得分等概率： ∑vi/cnt\sum v_i/cnt∑vi/cnt，vi 为得分，cnt 为总选择。简单求期望例题1：期望独立单独计算题目描述：有 n 道题，每道题有 ai 个答案。对于第 i 道题，小明随意的蒙了一个 [1,ai][1,a_i][1,ai] 的答案，即每道题都有 1/ai1/a_i1/ai 的概率对。可是小明抄错了，不小心把第 i 道题的答案

2020寒假培训期望dp（概率dp）题解

weixin_43925900的博客

01-11

1638

概率期望dp一般都是逆推。正推的话要计算期望的期望，非常麻烦！一般来说，总有一个末状态是一定会发生，从这个状态开始逆推可以简化许多问题。期望dp和普通的dp的不同处。普通的dp可能纪录的是dp[i]到了i这个状态时的最优解，而期望dp一般纪录dp[i]以i这个状态为起点能得到的最优解。

数学期望DP小结

海伦凯乐的算法

07-02

3364

最近刚学了数学期望DP，还是蛮恶心的，但是相比于其他DP还是比较好想的，主要思路和线性DP类似，主要注意的是概率计算利用加法原理加和的方式，还要注意避免数组下标为负的情况，需要进行平移。 Tyvj1864 守卫者的挑战比较简单的一道数学概率DP，要注意负数组下标。 f[i][j][k] 表示前i场赢了j场容量-地图为k的概率然后状态转移是：如果赢了，i+1，j+1，k进行相应变

hdu 4035 概率，求期望dp

冰

10-26

849

列方程，系数替换化简，递推求解参考：http://www.cnblogs.com/kuangbin/archive/2012/10/03/2711108.html /* HDU 4035 dp求期望的题。题意：有n个房间，由n-1条隧道连通起来，实际上就形成了一棵树，从结点1出发，开始走，在每个结点i都有3种可能： 1.被杀死，回到

【期望】【DP】数学期望总结（ing)

FFOYeah的博客

08-15

566

LightOJ - 1027 A Dangerous Maze

期望dp和概率dp的区别

07-29

期望dp和概率dp是两种不同的动态规划方法。期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中，我们通常定义dp\[i\]表示在第i个状态时的期望值，然后通过状态转移方程来更新dp数组，最终得到最终...