
深度强化学习
哀酱
自己的学习笔记,博客主要是写给自己看的顺便分享,可读性不佳评论不回复还请见谅见谅
展开
-
深度增强学习入门笔记(二)
知乎专栏智能单元的学习笔记,就真的只是一边看一边记的而已,仅为自己学习所用,侵删。价值函数value function价值函数是为了描述某一状态的潜在价值,然后进行决策。 其实人做决策的时候,一部分是直接基于策略,比如说如果我有10000块钱,我就买一部iPhone X,如果我有5000块,就买华为,如果我有3000块,就买小米。一部分是评估每一种想法的价值,然后选择价值高的,比如说iPhone原创 2017-12-14 22:14:46 · 1135 阅读 · 0 评论 -
深度增强学习入门笔记(一)
知乎专栏智能单元的学习笔记,仅为自己学习所用,侵删。从OpenAI看深度学习研究前沿OpenAI的三个主要研究方向 1. 深度生成模型 Deep Generative Model 通过学习现有的数据生成新的数据。 相关研究: 1)otoro.net 学习文字自动生成新的文字 2)Deep Dream Neural Art 画风迁移 3原创 2017-12-14 21:32:15 · 1093 阅读 · 0 评论