开始学习强化学习:
包括alphago等都是强化学习的典型。
最典型的强化学习的算法为Q learning,这个算法的简介博客:
https://www.zhihu.com/question/26408259
强化学习的github项目:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow
里面包含了很多算法的例子,非常值得学习。
强化学习的算法进展:从基本的Q Learning与Sarsa到后期的DQN(结合深度神经网络的强化学习)
这方面的一个专栏:http://blog.youkuaiyun.com/songrotek/article/details/50580904
关于DQN的实现,上面的github中有相应的实现。
double DQN算法的实现流程如下图:
——————————————————————————————————————————————
policy gradient增强学习算法的一个博客:
https://zhuanlan.zhihu.com/p/21725498
没有用框架的纯代码实现的一个github:https://gist.github.com/karpathy/a4166c7fe253700972fcbc77e4e