- 博客(4)
- 收藏
- 关注
原创 通俗讲解深度强化学习经典算法——DQN
DQN的核心思想就是训练一个Q网络,这个Q网络输入当前环境的状态,输出为agent所有动作的Q值,agent选择具有最大Q值的动作作为当前时刻的行动,以此循环往复直至回合结束。上述就是DQN的整体思想。此外,为了更好地训练Q网络以及保证算法的稳定性,论文提出了经验回放缓冲池、目标网络的思想,后续会详细讲解。
2024-08-17 21:29:43
2133
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人