100余行代码带你入门强化学习DQN算法

ReEchooo

已于 2022-01-31 11:40:31 修改

阅读量1.9k

点赞数 4

分类专栏：强化学习基础理论文章标签：算法 python 深度学习

于 2022-01-18 16:49:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_41773233/article/details/121671817

版权

强化学习基础理论专栏收录该内容

13 篇文章 ¥119.90 ¥299.90

订阅专栏

100余行代码带你入门强化学习DQN算法

1. 简介
2. 关键要点
3. 完整代码
4. 关于Nature DQN图像输入的处理手段

1. 简介

DQN算法是经典的强化学习算法，作为一个入门级的算法，深度强化学习领域的hello world，很有必要自己手动写一个简易实现。

2. 关键要点

DQN算法中，重要的是两个东西，一个是replay buffer，一个是agent。replay buffer涉及到经验的存储与采样。而agent中则涉及到构建神经网络与使用bellman equation更新网络。

2.1 replay buffer存储及采样数据

首先导入必要的库：

import copy
import gym
import torch
import torch.nn as nn

了解本专栏

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。