实现的强化学习框架包括:
1、A3C:论文链接 https://arxiv.org/abs/1602.01783
2、PPO: 论文链接 https://arxiv.org/abs/1707.02286, https://arxiv.org/abs/1707.06347
3、TD3:论文链接 https://arxiv.org/pdf/1802.09477.pdf
4、TRPO:论文链接 https://arxiv.org/abs/1502.05477
5、DDPG:论文链接 https://arxiv.org/abs/1509.02971
6、DQN:论文链接 https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
7、DDQN:论文链接 https://arxiv.org/pdf/1509.06461.pdf