【强化学习系列】超详细整理实用资料——1 强化学习概述(包含马尔科夫、贝尔曼方程、蒙特卡洛、时间差分法)
文章目录前言强化学习通用工作方式(敲重点!!)几个重要概念工作流程模型通用设计要点(每个模型都需要注重的点)强化学习适用场景马尔科夫马尔可夫链马尔可夫随机过程马尔可夫决策过程(敲重点!!)贝尔曼方程(敲重点!!)回报总回报价值折扣系数贝尔曼方程
前言
本菜鸡要写整个强化学习的资料啦,欢迎大家评论区讨论哦, 啾咪 q(≧▽≦q)
强化学习通用工作方式(敲重点!!)
这个图 超级 重要一定要清楚啊
几个重要概念
Agent:神经网络 ,可以看成人的大脑
Evironment:Agent所处的环境
原创
2021-09-06 10:36:10 ·
1824 阅读 ·
0 评论