
强化学习
文章平均质量分 89
强化学习相关技术
Quant0xff
资料搜集自网络,如有侵权,请联系删除
展开
-
【RL-Notes】Constraint Decoupling by Constraint Relaxiation
Constrained decoupling by constraint relaxiation原创 2021-12-10 14:04:59 · 649 阅读 · 1 评论 -
【OC】Bellman动态规划
最优控制,多级决策贝尔曼动态规划算法原创 2020-08-31 14:56:12 · 892 阅读 · 0 评论 -
【RL】MDP(2)
策略迭代和价值迭代原创 2020-08-04 09:23:34 · 195 阅读 · 0 评论 -
【RL】MDP(1)
强化学习基础,MDP,Bellman期望方程和Bellman最优方程原创 2020-08-03 19:52:02 · 218 阅读 · 0 评论