DynamicProgramming&Greedy的小启示

最新推荐文章于 2025-12-19 15:31:04 发布

原创最新推荐文章于 2025-12-19 15:31:04 发布 · 1.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #生活 #编程

Engine&Render 专栏收录该内容

242 篇文章

订阅专栏

本文探讨了动态规划与贪心算法在解决问题时的不同策略。动态规划通过逐步逼近的方法找到全局最优解，而贪心法则关注局部最优解，有时也能得到全局最优。文章通过实例解释了两种算法的特点，并讨论了它们在实际应用中的考量。

记得doom启示录里写道carmack相信，生活里的任何问题都可以编程解决。

尽管这个我觉得有点夸张，但是今天看算法导论时候的确感觉有些启示。

比如就是动态规划和贪心就是比较有指导作用的做法。

在寻找最优解的时候，动态规划就是从最小的子问题，然后一步步逼近到最终问题，逼近的过程可以说考虑现在和将来，逼近结束了，最优解也就是出现了。

贪心则是总是选择现有的最佳解。

这个让我想起了军队盛饭，就是想多吃点的先盛半碗，吃完在来一碗，这个就比较有前瞻性，就有更好的解。

反之先来一碗，之后就没有了，就差点。

有的时候做事何尝不如此，像动态规划一样去做事，定义好问题之后，一步步从始至终都考虑清楚，号称是高瞻远瞩，选取最优解。

贪心法显得目光就短浅很多，能否达到最优解就靠运气了。

另外，书中也讲到，贪心法需要一个动态规划做基础，在确定了贪心可以达到最优解的时候就用贪心，这个更加高效。

所以在斟酌好可以贪心的时候就看着眼前的事走也可以，那么就又是最优解，又是省心，那最棒了呃。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

安柏霖

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

动态规划（dynamic programming）与贪心算法（greedy algorithm）

weixin_30104533的博客

06-07

1425

《算法导论》动态规划笔记动态规划的方法是付出额外的内存空间来节省计算时间，是典型的时空权衡（time-memory trade-off）的例子。时间上的节省可能是非常巨大的，有可能将指数时间的解转化为多项式时间的解。应用动态规划方法求解的优化问题应该具备的两个要素：最优子结构和子问题重叠。最优子结构：如果一个问题的最悠久包含其子问题的最优解，我们就称此问题具有最优子结构性质。对于不同问题领域，最优...

动态规划(Dynamic Programming)与贪心算法(Greedy Algorithms)

無名黑洞

10-18

6782

动态规划动态规划是用来解决优化问题的，即要作出一组选择以达到最优解。动态规划有两个标志：一是可以划分最优子问题，二是子问题有重叠性(可以自底向上存储这些子问题的解，把算法效率从指数时间降到多项式时间）。例如，动态规划可以运用在矩阵相乘上。在矩阵连乘的时候，在中间增加括号是不影响最后结果的。也就是说 A * B * C = A * ( B * C )。假设A、B、C的维数为10 X 100,

参与评论您还未登录，请先登录后发表或查看评论

ε-greedy策略

Swift's Blog

09-10

1283

是强化学习中最重要、最基础的概念之一，它完美地解决了与之间的权衡问题。ε-greedy策略的流程如下：fill:#333;color:#333;color:#333;fill:none;是否开始生成一个随机数0<=rand<=1rand<ε?进行探索:完全随机选择一个动作进行利用:选择当前Q值最高的动作更新状态和Q值。

Epsilon-Greedy算法

热门推荐

拉风小宇的博客

10-19

3万+

翻译自 The Epsilon-Greedy Algorithm – James D.McCaffrey epsilon-greedy算法（通常使用实际的希腊字母ϵ\epsilonϵ）非常简单，并且在机器学习的多个领域被使用。epsilon-greedy的一种常见用法是所谓的多臂匪徒问题（multi-armed bandit problem）。假设你站在k = 3台老虎机前面。每台机器都...

Greedy Analysis Strategies

Steve Wang's blog

01-10

521

Greedy Analysis Strategies Greedy algorithm stays ahead. Show that after each step of the greedy algorithm, its solution is at least as good as other algorithm’s. Ex.Interval scheduling Structural...

ϵ-greedy Policies

Steve Wang's blog

10-25

6064

ϵ\epsilonϵ-greedy Policies 非常简单的平衡探索(Explotation)和利用(Exploitation)的思想是通过确保整个过程随机来实现的。实际上这个策略在论文里一般一句话就可以概括:ϵ\epsilonϵ-greedy policy that selects a random action with probability ϵ\epsilonϵ(不准确) or...

K-Center-Greedy算法讲解和python实现

AI蜗牛车

08-05

2136

前言K-Center-Greedy 算法在主动学习和数据采样、最大覆盖等方面有广泛的应用。最主要的思想是，可以用k个中心点来代表目前的数据分布。算法流程初始化：随机选择一个sample作为第一个中心。计算数据集中每个sample到中心点的距离，并找出每个sample到中心点最小的距离，即计算数据集中每个点到其最近中心点的距离，我们称之为每个点的最近中心点距离。选择目前所有样本点中的最近中心点距离最...

day2_greedy&Intervals&LRU/LFU

wugong_true的博客

05-10

895

因为同时维护map的双端链表，需要抽象出来几个方法在对元素操作时同时操作map和DoubleList，防止漏掉操作，比如说删除某个。使用哈希双端链表(Java中对应的是LinkedHashMap)说的有点玄幻，实际上很简单，就是尽量让 ==LRU 的主方法。使得我们可以在 O(1) 时间访问链表的任意元素。get逻辑比较简单，这里阐述一下put的逻辑。1288删除被覆盖区间，返回剩余区间的数量。LRU 算法的核心数据结构是使用哈希链表。使得链表元素维持插入顺序，同时借助。哈希映射的快速访问能力。

greedy策略求解工作选择问题（一）

大学摄影爱好者

12-18

566

工作选择问题是活动选择问题和背包问题的一个集成，因为背包问题的greedy思想是每次选择当前性价比最高的物品；同时活动选择问题的geedy思想不是选择价值最大的物品，而是根据具体的问题要求，即在所有活动结束前，一个人最多能完成多少个活动，所以活动选择问题的greedy思想是如果当前的活动能越早结束，则一个人将越能尽快的完成下一个活动，这样最后就能完成最多的活动，其中活动的结束时间和...

智驾空间智能、物理智能、世界模型相关的最新论文和开源算法链接

Bonaventure的博客

12-16

949

这些资源涵盖了2025年自动驾驶领域的前沿研究，从空间推理到物理建模和世界模拟，提供了丰富的开源工具和理论框架。建议用户通过链接深入探索论文和代码，以应用于实际项目或进一步研究。如果您需要更详细的解读或特定应用建议，请随时补充信息！

(leetcode) 力扣100 15轮转数组（环状替代）

qq_62235017的博客

12-18

583

我们利用这个过程，首先计算需要多少个从起点走回起点的圈数（count，为数组长度与步数的最大公约数，具体推推导后面会给），然后再遍历每一圈，通过创建一个临时变量（current,next，类似于指针的作用），来存储需要移动的变量将其移动到下一个位置，而下一个位置变为信的需移动变量，直到走完当前圈数。我们可以把数组想象一个圆圈，如果我们每次固定步数前进，肯定会在有限圈数回到出发点，这个过程中，有可能会遍历完数组所有数，有可能遍历有限数。这句话的意思是：在这个游戏中，你启动一次任务，只能覆盖到。

JVM 之垃圾回收算法及其内部实现原理【垃圾回收的核心问题有哪些？分别怎么解决的？可达性分析解决了什么问题？回收算法有哪些？内部怎么实现的？】

人生快意事，读的好书，觅得良友

12-16

1253

JVM垃圾回收面临的核心问题有哪些？分别怎么解决的？可达性分析解决了什么问题？回收算法有哪些？内部怎么实现的？根节点枚举、安全点、安全区域、记忆集与卡表、写屏障、并发性可达性分析各自解决了什么问题？怎么协同工作的？ G1中他们是怎么协作的？

从零开始写算法——链表篇4:删除链表的倒数第 N 个结点 + 两两交换链表中的节点

m0_59624833的博客

12-15

827

hot100链表的两道题详解。

【算法笔记】AC自动机

最新发布

u012559967的专栏

12-19

506

AC自动机: AC自动机是一种高效的多模式字符串匹配算法，它巧妙地将 Trie树的字典结构与 KMP算法的失配指针思想相结合，能同时在一段文本中查找多个模式串的所有出现位置，广泛应用于敏感词过滤、生物信息学序列分析等领域。在字符串匹配领域，我们会遇到两类问题：单模式匹配：给定一个文本字符串和一个模式字符串，判断模式字符串是否出现在文本字符串中。《【算法笔记】KMP算法》多模式匹配：给定一个文本字符串和多个模式字符串，判断所有模式字符串是否出现在文本字符串中。解决方案：AC自动机算法。

【光伏风测功率预测】风光储一张网：多场站功率预测与协同调度的算法框架解析

专注AI大模型,软件混淆,授权

12-16

259

摘要：随着新能源渗透率提升，风光储一体化系统从单场站运行转向集群化运营，亟需多场站功率预测与协同调度解决方案。本文提出"数据层-预测层-调度层-运维层"四层架构：通过多源气象融合和站点拓扑构建数据基础；采用GNN+Transformer等图时空模型实现多场站联合预测；基于概率预测(P10/P50/P90)和MPC滚动优化进行储能调度；配套MLOps保障系统稳定性。该方案能降低聚合预测误差15%-30%，减少偏差考核费用20%以上，提升现货交易收益，为风光储基地和虚拟电厂提供可落地的技术路

Z字形扫描ccf

douyh的专栏

12-15

409

就会发现路径在对角线上不断来回折返，视觉上是一个连续的 Z / 反 Z / Z / 反 Z。三、Java 实现（推荐，O(n²)，n≤500 完全没问题）题目中的“Z 字形扫描”不是“每条对角线都同方向”按 i+j 分对角线 + 按对角线编号奇偶交替方向。二、真正的 Zigzag 规则（以题目为准）d 为偶数从下往上（i 大 → i 小）d 为奇数从上往下（i 小 → i 大）这才是 Z 字形的来源（方向来回折返）一、Z 字形扫描规则总结（非常关键）五、为什么这种才叫“Z 字形”？

从0开始学算法——第十五天（滑动窗口练习）

2401_84407045的博客

12-13

1530

学习了今天的基础知识，让我们来做几道题来练练手吧。（题目是别的地方扒来的，参考答案是我自己写的，肯定不是最优解，有更好的方法欢迎评论区交流）

算法笔记19 - 图和通用结构 | 图的两种遍历 | 三种拓扑排序 | 两种最小生成树算法Kruskal, Prim | 最短路径算法Dijkstra

zyw4259的博客

12-16

756

本文提出了一种通用的图结构设计方案，包含节点(Node)、边(Edge)和图(Graph)三个核心类，能够将不同输入格式的图统一转换为标准结构。基于该结构实现了两种图遍历算法：BFS采用"进队时标记"策略避免重复访问，DFS通过"curr回压+break"技巧模拟递归调用栈。此外还介绍了三种拓扑排序方法，重点分析了基于入度的Kahn算法(BFS思想)，通过维护入度表和零入度队列实现。这种"通用结构+标准算法"的设计模式可以有效降低不同图算法题目间的

-greedy

12-05

在提供的引用中，涉及到与 -greedy 相关的主要是 Greedy 和 Epsilon - Greedy。 Greedy 技术常用于资源受限场景，如在智能手机和平板电脑等移动设备中，该技术通过逐个选择具有最高加权效用的应用变体，在一定程度上减少了计算复杂度和资源消耗。例如在资源有限的智能手机上同时运行多个社交、娱乐和办公应用时，Greedy 技术可发挥作用，不过 Serene Greedy 技术在其基础上更进一步，通过考虑自适应的非功能方面，进行重要性判断和应用分类，避免不必要的自适应，在保证一定效用的同时，减少对用户体验的负面影响 [^1]。 Epsilon - Greedy 是强化学习中的一种策略。强化学习关注智能体在与环境的交互中学习最优策略以最大化累积奖励，在很多领域如游戏 AI、机器人控制、自然语言处理等有广泛应用。而 Epsilon - Greedy 变体相对基本的形式稍微复杂一些，与基本的 Epsilon - Greedy 变体相比，后续讨论的变体需要优化更多的参数，有时特定的算法变体甚至可能需要在估计过程中存储值才能正常工作，这些因素会进一步增加行为策略的复杂性 [^2][^4]。 ### 代码示例（简单的 Epsilon - Greedy 策略伪代码） ```python import random # 定义 Epsilon - Greedy 策略函数 def epsilon_greedy(epsilon, actions, q_values): if random.uniform(0, 1) < epsilon: # 探索：随机选择一个动作 return random.choice(actions) else: # 利用：选择具有最高 Q 值的动作 max_q_index = q_values.index(max(q_values)) return actions[max_q_index] # 示例使用 actions = [0, 1, 2] # 动作列表 q_values = [0.1, 0.5, 0.3] # Q 值列表 epsilon = 0.2 # Epsilon 值 selected_action = epsilon_greedy(epsilon, actions, q_values) print(f"选择的动作是: {selected_action}") ```