
强化学习
文章平均质量分 96
万能的仓鼠
这个作者很懒,什么都没留下…
展开
-
强化学习 - 概述
强化学习-概述 课程来自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的笔记整理强化学习的”Hello-world”规则绿色是目标红色是失败黑色是墙start是开始点你要找到一条从start到目标的路径思考如果给定一个附加概率:按着想法走的0.8,不按想法走的0.2。如果我们假定正确序原创 2017-11-18 13:49:00 · 2372 阅读 · 0 评论 -
机器学习相关知识速查 - 持续更新
机器学习相关概念机器学习相关概念线性代数张量生成子空间范数特征分解奇异值分解SVDMoore-Penrose 伪逆迹运算概率与信息论概率随机变量概率分布边缘概率条件概率条件概率链式法则条件独立与独立性期望方差协方差常用概率分布伯努利分布BernoulliMulti-nouli 多项式分布正态高斯分布指数分布与拉普拉斯laplace分布Dirac 分布与经原创 2017-11-18 14:46:29 · 602 阅读 · 0 评论 -
AlphaGo Zero 与深度强化学习(一) 概述
AlphaGo Zero 与深度强化学习(一) 概述 原文: Mastering the Game of Go without Human Knowledge(2017)做的什么完全基于强化学习,使AlphaGoZero(下文简称 zero)通过自己的神经网络在很短的时间打败了前 AlphaGo。完全无人类数据干预。使用强化深度学习输入特征简单提到的的技术强化学习深度学习原创 2017-12-15 16:50:44 · 5515 阅读 · 0 评论