
Reinforcement Learning
糖小豆子
做一个快乐的程序员,啃一口酱猪蹄忘记所有烦恼。
展开
-
David Silver强化学习公开课笔记:Lecture 1 强化学习入门
第一课主要解释了强化学习在多领域的体现,主要解决什么问题,与监督学习算法的区别,完整的算法流程由哪几部分组成,其中agent包含的内容,以及解释了强化学习涉及到的一些概念。 本课视频地址:RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning 本课ppt地址:http://www0.cs.ucl...转载 2018-05-22 11:24:50 · 977 阅读 · 3 评论 -
论文笔记《Neural Architecture Search With Reinforcement Learning》
摘要神经网络是一种强大而灵活的模型,能够很好地解决图像、语音和自然语言理解中的许多困难学习任务。尽管成功,神经网络仍然很难设计。在本文中,我们使用一个循环网络来生成神经网络的模型描述,并通过强化学习训练该RNN,以最大限度地提高生成的架构在验证集上的预期精度。在cifar-10数据集上,我们的方法从无到可以设计出一种新的网络体系结构,在测试集精度方面可以与人类发明的最佳体系结构相媲美。我们的ci...翻译 2019-04-25 15:09:42 · 837 阅读 · 0 评论