
强化学习(Reinforcement Learning)
文章平均质量分 54
强化学习算法/Code学习
Katniss-丫
//菜鸡冲鸭
展开
-
Self-Attention with Relative Position Representations
Hi,这是第四篇算法简介呀!论文链接:Self-Attention with Relative Position Representations,2018文章概述 Vaswani等人提出了只用注意力机制的Transformer,没有显式地建立相对位置或绝对位置信息的模型。这篇文章提出了一种有效地将相对位置表示纳入Transformer的Self-Attention中的方法。 在Tran...原创 2019-11-15 00:15:37 · 813 阅读 · 0 评论 -
DQN(Deep Q-Network)
Hi,这是第一篇算法简介呀论文链接: “Human-level control through deep reinforcement learning”.文章概述 本文首次提出了一种深度学习模型,利用强化学习的方法,直接从高维的感知输入中学习控制策略。 DL算法需要大量手工标记数据,而RL中从输入到获得reward信号存在稀疏、有噪声和延迟的问题。DL算法假设data是独立的;而在RL...原创 2019-09-16 20:29:41 · 760 阅读 · 0 评论 -
DDPG(Deep Deterministic Policy Gradient)
Hi,这是第二篇算法简介呀论文链接:“Continuous control with deep reinforcement learning.” 文章概述公式理解伪代码分析试验结果分析代码实现原创 2019-09-18 02:10:12 · 2516 阅读 · 0 评论 -
[论文翻译]Actor-Attention-Critic for Multi-Agent Reinforcement Learning
Hi,论文翻译仅供参考,想了解细节还是建议阅读原文论文链接:Actor-Attention-Critic for Multi-Agent Reinforcement Learning引入注意力机制的Actor-Critic多智能体强化学习算法摘要 多智能体场景中的强化学习对于实际应用程序非常重要,但它带来的挑战超出了单智能体场景中的挑战。我们提出了一个在多智能体环境中分散训练策略的Act......翻译 2019-09-23 22:40:33 · 4060 阅读 · 5 评论 -
SAC(Soft Actor-Critic)
Hi,这是第三篇算法简介呀论文链接:Soft Actor-Critic:Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor,2018,ICML文章概述 强化学习的两个主要挑战是高样本复杂性和收敛性脆弱。在这篇文章中,提出了一个基于最大熵框架的actor-critic离线策略的深度强化学...原创 2019-09-25 21:25:55 · 5160 阅读 · 0 评论