- 博客(17)
- 收藏
- 关注
原创 Leecode滑动窗口算法实战:最小覆盖子串问题详解
本文深入解析一段解决最小覆盖子串问题的C++代码,该算法通过巧妙的滑动窗口技术在O(n)时间内高效解决问题。给你一个字符串 s 、一个字符串 t。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “”。对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。如果 s 中存在这样的子串,我们保证它是唯一的答案。输入:s = “ADOBECODEBANC”, t = “ABC”输出:“BANC”
2025-11-28 17:04:33
239
4
原创 如何优化电力系统潮流分布:最优潮流(OPF)问题
摘要 最优潮流(OPF)是电力系统优化运行的核心问题,通过构建包含决策变量(发电机出力、节点电压等)、目标函数(最小化发电成本)和约束条件(潮流方程、安全限制)的非线性规划模型。该问题具有大规模、非凸特性,求解难度大。文中建立了3节点系统的OPF数学模型,并采用Python实现数值求解,包括构建导纳矩阵、计算潮流方程等关键步骤。工程实践中常采用内点法、顺序逼近等方法获取满足精度要求的局部最优解,为电力系统经济运行提供决策支持。
2025-11-28 17:03:08
876
6
原创 强化学习笔记:Diffusion Policy
扩散模型的产生为强化学习带来了全新的思路,它通过类似“迭代去噪”的生成方式,将随机噪声优化为高质量的动作序列。这种方法能天然处理任务中存在的多种合理解决方案,有效避免了传统算法输出保守“平均解”的问题。无论是作为直接生成动作的策略,还是进行长远规划的规划器,扩散模型都显著提升了智能体在复杂任务中的决策质量和行为多样性,尤其适合需要精细控制的机器人等领域,尽管其计算成本较高,但已成为该领域最具潜力的技术方向之一。
2025-11-26 21:04:26
746
4
原创 强化学习笔记:Expected SARSA算法
Expected SARSA 是一种强化学习中的时序差分(Temporal-Difference, TD)控制算法。它是经典 SARSA 算法的一个直接且强大的变体,同时,Expected SARSA也是一种on-policy算法。核心思想:在更新 Q 值时,不依赖于随机采样得到的单个下一个动作 ,而是使用在当前策略下,下一个状态所有可能动作的 Q 值的期望(加权平均)。
2025-11-22 16:31:43
1188
10
原创 RL学习笔记:SARSA算法
SARSA (State-Action-Reward-State-Action)算法,是强化学习算法的一种,可以视为Q-Learning算法的一种改进。其特点为model-free, value-based, on-policy。
2025-11-21 20:15:05
881
3
原创 西瓜的matlab小白级笔记——2.3 认识变量
除了上述条件之外,matlab和python等语言不同的是,matlab不需要事先声明变量,也不需要规定变量的数据类型。
2025-07-19 22:26:23
336
原创 [ Python ] 01 数据可视化门类一览——初学者也能学会
数据可视化图表大全(现在可能还不太全),可能使用库:matplotlib,seaborn,pyecharts,wordcloud
2024-08-31 21:03:55
1518
数学物理方法思维导图(白底版)
2025-05-19
数学物理数学物理方法思维导图:基础理论及应用(参考书:顾樵《数学物理方法》)
2025-05-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅