
控制算法
文章平均质量分 59
cong_twodogs
这个作者很懒,什么都没留下…
展开
-
Sarsa算法与Q-learning在训练游戏时的思考
Sarsa算法与Q-learning思考Sarsa算法它与Q-learning相当的相似,不同点在于Q-learning在现实值代入的是s2状态下的最大值,而Sarsa是选择在s2上实实在在走的动作a,这个a可能是所有动作里的最大值,也可能不是。Sarsa算法我愿称之为说到做到型算法!如果思考比较两种算法选择最大值与否对算法的后续影响的话,Sarsa训练学习到的孩子,更容易偏向获得更高利益的动作,比方说他通过一直执行a2学习动作最后得到了高回报,那么下一次他学习时,就更偏向一直做a2学习动作,即使原创 2021-08-11 21:58:48 · 342 阅读 · 0 评论 -
部分先进控制技术的原理及推导(3)——模型预测控制
部分先进控制技术的原理及推导(3)——模型预测控制模型预测控制(MPC: Model Prediction Control)是一种基于模型的闭环优化控制策略。从我的理解来说,他是其实就是一种数学算法,用来对模型的输出进行控制。模型预测控制的基本算法有模型算法控制(MAC:Model Algorithm Control),动态矩阵控制(DMC:Dynamic Matrix Control),广义预测控制(GPC: Generalized Predictive Control)等,他们的基本预测模型的选择有原创 2020-11-18 19:05:51 · 3140 阅读 · 0 评论 -
部分先进控制技术的原理及推导(2)——内模控制技术
部分先进控制技术的原理及推导(2)4.内模控制技术内模控制(Internal Model Control, IMC)是一种基于过程数学模型进行控制器设计的新型控制策略。常规PID难以适于强耦合多变量、强非线性和大时滞过程。利用内模控制原理可以对PID进行优化和参数整定。...原创 2020-11-18 18:13:18 · 9516 阅读 · 1 评论 -
部分先进控制技术的原理及推导(1)
部分先进控制技术的原理及推导最近正在学习先进控制技术,特做了部分控制技术的推导简单的概念,方便自己能及时回顾与理解,由于这里的公式记录太麻烦,所以直接用word写公式然后截图留存,未经作者授权禁止转载。1.补偿控制1)前馈补偿控制是一种事前控制方式,在理论上可以运用不变性原理彻底消除误差,实现对扰动的完全补偿。2)前馈-反馈控制3)串联前馈控制2.史密斯(smith)预估控制适用于有纯延时的模型,理论上能够消除纯延时对系统的动态影响,但使用的前提是需要知道被控过程的精确模型,在实际工原创 2020-11-17 21:57:09 · 2244 阅读 · 0 评论