
Reinforcement Learning
文章平均质量分 88
蓝色枫魂
一个做音乐的程序员,欢迎关注公众号【比特猫BitTom】,聊聊音乐、技术和人生~
展开
-
深度强化学习:入门(Deep Reinforcement Learning: Scratching the surface)
本博客是对学习李宏毅教授在youtube上传的课程视频《Deep Reinforcement Learning: Scratching the surface》所做的笔记,供大家学习参考。需要翻墙:课程视频链接热度起源RL的方案学习Go监督学习与增强学习更多应用RL的难点后面内容的大纲Policy-based ApproachLearning an Actor热度起源15年2月:Goo原创 2017-11-21 16:39:36 · 23515 阅读 · 0 评论 -
强化学习之六:Deep Q-Network and Beyond
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl...翻译 2018-02-09 21:55:32 · 2651 阅读 · 0 评论 -
强化学习之七:Visualizing an Agent’s Thoughts and Actions
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl...翻译 2018-02-09 21:59:15 · 588 阅读 · 0 评论 -
强化学习之五:基于模型的强化学习(Model-based RL)
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl翻译 2018-01-07 18:46:31 · 18095 阅读 · 0 评论 -
强化学习之四:基于策略的Agents (Policy-based Agents)
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl翻译 2018-01-07 18:46:02 · 3176 阅读 · 0 评论 -
强化学习之一:从TensorFlow开始(Start from TensorFlow)
本文是对Tensorflow官方教程的个人(tomqianmaple@outlook.com)中文翻译,供大家学习参考。官方教程链接tf的扬帆起航Getting Started With TensorFlow张量Tensorstf核心教程TensorFlow Core tutorial导入tfImporting TensorFlow计算图The Computational Gr翻译 2018-01-01 12:45:41 · 1396 阅读 · 0 评论 -
强化学习之三点五:上下文赌博机(Contextual Bandits)
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl翻译 2018-01-07 18:43:48 · 18367 阅读 · 8 评论 -
强化学习之三:双臂赌博机(Two-armed Bandit)
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译,该翻译是基于个人分享知识的目的进行的,欢迎交流!(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com. And my work is compl翻译 2018-01-07 18:42:29 · 5065 阅读 · 0 评论 -
强化学习之二:Q-Learning原理及表与神经网络的实现(Q-Learning with Tables and Neural Networks)
本文是对Arthur Juliani在Medium平台发布的强化学习系列教程的个人中文翻译。(This article is my personal translation for the tutorial written and posted by Arthur Juliani on Medium.com。)原文地址(URL for original article):https://med翻译 2018-01-07 18:40:49 · 15968 阅读 · 0 评论 -
机器学习之强化学习概览(Machine Learning for Humans: Reinforcement Learning)
声明:本文翻译自Vishal Maini在Medium平台上发布的《Machine Learning for Humans》的教程的《Part 5: Reinforcement Learning》的英文原文(原文链接)。该翻译都是本人(tomqianmaple@outlook.com)本着分享知识的目的自愿进行的,欢迎大家交流!关键词:探索和利用、马尔科夫决策过程、Q-Learning、策翻译 2018-01-06 16:16:27 · 4688 阅读 · 0 评论 -
从马尔科夫决策过程到强化学习(From Markov Decision Process to Reinforcement Learning)
从马尔科夫决策过程到强化学习(From Markov Decision Process to Reinforcement Learning)作者:Bluemapleman(tomqianmaple@outlook.com)Github:https://github.com/bluemapleman (欢迎star和fork你喜欢的项目)知识无价,写作辛苦,欢迎转载,但请注明出处,谢谢!前...原创 2018-11-05 11:17:46 · 3174 阅读 · 0 评论