100余行代码带你入门强化学习DQN算法
1. 简介
DQN算法是经典的强化学习算法, 作为一个入门级的算法,深度强化学习领域的hello world,很有必要自己手动写一个简易实现。
2. 关键要点
DQN算法中,重要的是两个东西,一个是replay buffer,一个是agent。replay buffer涉及到经验的存储与采样。而agent中则涉及到构建神经网络与使用bellman equation更新网络。
2.1 replay buffer存储及采样数据
首先导入必要的库:
import copy
import gym
import torch
import torch.nn as nn