
深度强化学习
文章平均质量分 88
草帽B-O-Y
AI学习者及爱好者
展开
-
深度强化学习控制移动机器人
使用深度强化学习控制移动机器人在复杂环境中避障、收集物品到指定点。所用到的算法包括DQN、Deuling-DDQN、A3C、DDPG、NAF。原创 2017-06-10 17:47:31 · 14574 阅读 · 3 评论 -
深度强化学习——DQN
DQN(Deep Q-Learning)可谓是深度强化学习(Deep Reinforcement Learning)的开山之作,是将深度学习与增强学习结合起来从而实现从感知(Perception)到动作( Action )的端对端(End-to-end)学习的一种全新的算法。原创 2017-06-05 21:55:24 · 114802 阅读 · 20 评论 -
深度强化学习——Dueling-DDQN
深度双Q网络(DDQN)和基于竞争构架Q网络(Dueling-DQN)都是DQN的改进版本,前者是对DQN训练算法的改进,后者是对DQN模型结构的改进。原创 2017-06-13 09:38:56 · 33990 阅读 · 0 评论 -
深度强化学习——A3C
异步的优势行动者评论家算法(Asynchronous Advantage Actor-Critic,A3C)是Mnih等人根据异步强化学习(Asynchronous Reinforcement Learning, ARL) 的思想,提出的一 种轻量级的 DRL 框架,该框架可以使用异步的梯度下降法来优化网络控制器的参数,并可以结合多种RL算法。原创 2017-06-13 20:32:33 · 53573 阅读 · 3 评论 -
深度强化学习——连续动作控制DDPG、NAF
传统的DQN只适用于离散动作控制,而DDPG和NAF是深度强化学习在连续动作控制上的拓展。原创 2017-06-14 16:03:22 · 50645 阅读 · 8 评论