DQN 采用的是 神经网络 + Q-learning 的方法
有些情况,状态比较多,采用表格的方式不大现实,所以采用神经网络的方式
原视频:
https://www.bilibili.com/video/av16921335?p=14
DQN 采用的是 神经网络 + Q-learning 的方法
有些情况,状态比较多,采用表格的方式不大现实,所以采用神经网络的方式
原视频:
https://www.bilibili.com/video/av16921335?p=14