
深度强化学习
码上中年
目前从事于开发大数据平台开发,主要是开发特征工程工具、机器学习算法。然后将平台开发好供公安系统进行各种数据挖掘,分类,预测。
展开
-
强化学习基础一
注:强化学习问题的求解主要是基于动态规划算法 强化学习的知识点 1. 强化学习的基本模型: MDP 2. 利用和探索 3. 值函数和动作 4. 模型的求解方式,包含值迭代和策略迭代的求解算法 5. 无模型学习算法,包括蒙特卡洛算法-MC算法和时序差分算法-TD算法 6. 逆向强化学习简述 1. 如何使用马尔科夫决策过程描述一个强化学习的问题 1. 隐马尔可夫模型HMM是一个关于时序的概率模型,描...原创 2019-11-24 18:36:15 · 145 阅读 · 0 评论 -
深度强化学习理论学习
1. 强化学习 是一种学习如何能够最大化当前场景中的奖励值得学习方法,实际上就是一种从状态到动作的映射关系的学习,通过奖励值最大化来终结学习。 2. 强化学习两大特征: 实验式求解方式(试错法)、奖励延迟机制 3. ...原创 2019-11-24 16:14:32 · 807 阅读 · 0 评论